密ベクトル検索 (Dense Retrieval)
読み: みつべくとるけんさく
最終更新: 2026-06-30・AI PICKS編集部
定義
密ベクトル検索とは、テキストをニューラルネットワークで高次元の密なベクトルに変換し、意味的な類似度によってドキュメントを検索する技術のこと。
密ベクトル検索 (Dense Retrieval)とは — 詳しく解説
密ベクトル検索(Dense Retrieval)は、BM25などのスパース検索と対比される手法で、クエリと文書の両方をニューラルネットワーク(主にbi-encoder型)で密なベクトル(通常768〜1,536次元)に変換し、コサイン類似度や内積で最近傍を高速探索する技術。RAGシステムの検索層として広く採用されている。 2026年現在、現場での実運用上の落とし穴は主に3点ある。①ドメイン適合性の問題——汎用埋め込みモデル(text-embedding-3-large等)は一般的な質問応答には強いが、医療・法務・社内専門用語が頻出するコーパスでは精度が下がりやすく、ファインチューニングを施すとコストが一気に跳ね上がる。②インデックス規模とメモリ——100万件規模をFAISS等でインデックス化するとメモリが数十GB必要で、再インデックスも重い。③更新頻度の高いコーパスとの相性の悪さ——差分更新のたびにベクトル再計算が走るため、ニュースや在庫情報など鮮度重視のデータには向かない。 コスト相場感としてはOpenAIのtext-embedding-3-smallで100万トークンあたり約$0.02と安価だが、Pineconeなどのベクトルホスティング費用が月数十〜数百ドル規模になりやすい。AI PICKSで観測する限り、スパース検索(BM25)とのハイブリッド構成が現場の事実上の標準になっており、密ベクトル検索単体での本番運用は減少傾向にある。
密ベクトル検索 (Dense Retrieval)の使用例
- 社内規程検索に導入した事例では、「代休申請の手順」のような曖昧なクエリへの正答率がキーワード検索比で約85%に向上した。
- ECサイトの商品検索でBM25から密ベクトル検索に切り替え、類義語・言い換えに対応したことでコンバージョン率が12%改善した事例がある。
密ベクトル検索 (Dense Retrieval)に関連するAIツール
関連用語
「RAG・検索拡張」の他の用語
Retrieval-Augmented Generation。 社内資料や外部 DB を検索してから AI に答えさせる仕組み。
文章や画像を 数値ベクトルに変換する技術。 類似度検索や RAG の基礎。
出典付きで回答する AI 検索エンジン。 リサーチ業務で従来検索を置き換える。
Google 検索の上位に AI が回答を提示する 「AI Overviews」 や Perplexity 等の新世代検索。
Embedding (数値ベクトル) を高速に類似度検索するための専用 DB。 Pinecone / Qdrant / Weaviate が代表。
NotebookLMとはGoogleが提供するRAGベースのAIリサーチアシスタントのこと。ユーザーがアップロードした文書のみを情報源として回答を生成するため、ハルシネーションを大幅に抑制できる。
AI用語辞典をすべて見てみませんか
12カテゴリ・352語以上を体系的に整理しています
辞典トップへ