Snowflake Cortexとは

Snowflake Cortexは、データウェアハウス「Snowflake」上で大規模言語モデル(LLM)をSQLから直接呼び出せるネイティブAI機能群です。データを外部のAI基盤に移動させることなく、保存先のデータベース内でテキスト要約・感情分析・翻訳・分類・マルチモーダル分析を実行できます。BI担当やデータエンジニアが、既存のSQL知識のままAIをパイプラインに組み込めるため、データ規制が厳しい金融・医療・製造業のアナリティクス基盤として導入が進んでいます。

主要機能

1. COMPLETE関数によるLLM呼び出しSNOWFLAKE.CORTEX.COMPLETE('llama3-70b', prompt)という1行のSQLで、テーブル内の数万件のテキストカラムに対し一括で要約・分類を実行。従来はPython側でAPIを叩いて数時間かかっていたバッチ処理が、数分で完結します。

2. Cortex Search(RAG基盤):ベクトル検索と全文検索を統合したハイブリッド検索エンジン。社内ドキュメントを取り込めば、別途Pinecone等のベクトルDBを構築せずRAGアプリを立ち上げられます。

3. Cortex Analyst(自然言語→SQL):ビジネスユーザーが日本語・英語で質問するとSQLに変換し、データウェアハウスに対して実行。BIダッシュボードの作成依頼を待つ必要がなくなります。

4. マルチモーダルCOMPLETE:画像とテキストを同じSQL文で処理可能。商品画像から属性抽出してそのままテーブルに格納する用途に対応します。

編集部の検証メモ

公開ドキュメントとプライシングページを照合した範囲では、Cortexは標準のコンピュート課金とは別に「Cortex関数のトークン単価」と「サービングウェアハウスのクレジット消費」が二重で発生する構造です。Seemore Data社のレポートでは、設計を誤ったクエリ1本で数千クレジット(試算で約5,000ドル相当)が消えた事例も報告されており、コスト監視が必須。競合のDatabricks Mosaic AIやBigQuery MLと比較すると、データ移動ゼロでLLM実行できる点とSnowflakeの既存ガバナンス(RBAC・マスキング)がそのまま効く点が最大の差別化要素です。データ抽出→外部API送信→結果書き戻しという往復ETLが消えるため、感情分析バッチで月20〜40時間の運用工数削減が見込めます。

想定ユーザー

すでにSnowflakeをデータ基盤として運用し、機密データを外部に出さずにAI処理を内製化したい大企業のデータチーム向け。逆に、Snowflakeを未導入のスタートアップや、小規模データを軽くLLM処理したいだけのチームには、契約コストとクレジット管理の負荷が見合わないため不向きです。