コサイン類似度 (Cosine Similarity)
読み: こさいんるいじど
最終更新: 2026-06-26・AI PICKS編集部
定義
コサイン類似度とは、2つのベクトルがなす角度のコサイン値でテキストや画像の意味的な近さを0〜1の数値で表す類似度指標のこと。RAGの文書検索や推薦エンジンのスコアリングに広く使われる。
コサイン類似度 (Cosine Similarity)とは — 詳しく解説
コサイン類似度は、高次元ベクトル空間で2つのベクトルがなす角度を指標とする類似度計算手法だ。値は-1〜1の範囲を取り、1に近いほど意味的に似ており、0で無関係、-1で反対を意味する。実際にはL2正規化済みembeddingを使うケースが大半のため、実運用では0.7以上を「類似」の目安とすることが多い。 RAGシステムでは「ユーザーの質問ベクトル」と「ドキュメントチャンクベクトル」のコサイン類似度を計算し、上位k件をLLMのコンテキストに渡す設計が標準だ。AI PICKSの調査によると、2026年現在の相場感は月間100万クエリのRAGで月2〜5万円程度(embeddingコスト含む)。 現場での落とし穴は3点ある。①「意味が逆なのにスコアが高い」問題:「この製品は良い」と「この製品は悪い」が近い値を示すケース。②embeddingモデルの言語依存:英語特化モデルで日本語を処理するとスコアが無意味になる。③短文バイアス:短いクエリと長いチャンクの比較でスコアが下がりやすい。 現場での選び方として、コサイン類似度単体よりBM25との「ハイブリッド検索」が2026年の業界標準になりつつある。専門用語・固有名詞はBM25、意味的なクエリはコサイン類似度と使い分けることでリコール率が改善する事例が増えており、Cross-Encoderによる再ランキングをセットで組み込むパターンも浸透中だ。
コサイン類似度 (Cosine Similarity)の使用例
- ECサイトFAQボット構築例:ユーザー質問をembeddingし、コサイン類似度0.85以上のFAQチャンクをGPT-4oに渡すことで検索ヒット率が従来キーワード検索の2倍以上に改善。
- 社内文書RAGの設定例:multilingual-e5モデルでembeddingを生成し、コサイン類似度 > 0.78の上位3チャンクをコンテキストに含めることで幻覚率を低減。
コサイン類似度 (Cosine Similarity)に関連するAIツール
関連用語
「RAG・検索拡張」の他の用語
Retrieval-Augmented Generation。 社内資料や外部 DB を検索してから AI に答えさせる仕組み。
文章や画像を 数値ベクトルに変換する技術。 類似度検索や RAG の基礎。
出典付きで回答する AI 検索エンジン。 リサーチ業務で従来検索を置き換える。
Google 検索の上位に AI が回答を提示する 「AI Overviews」 や Perplexity 等の新世代検索。
Embedding (数値ベクトル) を高速に類似度検索するための専用 DB。 Pinecone / Qdrant / Weaviate が代表。
NotebookLMとはGoogleが提供するRAGベースのAIリサーチアシスタントのこと。ユーザーがアップロードした文書のみを情報源として回答を生成するため、ハルシネーションを大幅に抑制できる。
AI用語辞典をすべて見てみませんか
12カテゴリ・152語以上を体系的に整理しています
辞典トップへ