リランキング (Re-ranking)
読み: りらんきんぐ
最終更新: 2026-06-25・AI PICKS編集部
定義
リランキングとは、RAGシステムで初回検索した候補文書を、より高精度なモデルで再スコアリングし、関連度順に並び替える技術のこと。
リランキング (Re-ranking)とは — 詳しく解説
リランキングは RAG パイプラインの精度向上に欠かせない工程。一般的なベクトル検索(embedding + ANN)は速度優先の設計で上位 50〜100 件を高速に絞り込むが、意味的な関連度の見落としが多い。そこでクロスエンコーダー型のリランカー(Cohere Rerank、BGE-Reranker 等)が候補を精査し、実際に LLM に渡す上位 5〜10 件を選び直す。 2026年の実運用における落とし穴は主に3点。①コスト:Cohere Rerank API は 1,000 クエリあたり約 $0.10〜$0.20 で、大規模利用では月数万円の追加コストになる。②レイテンシ:クロスエンコーダーはクエリ×文書ペアを全評価するため、候補数が多いほど応答時間が伸び、50 件で +200〜500ms 程度かかる。③効果の頭打ち:初回検索の精度が低すぎるとリランキングでは救えない(Garbage in, garbage out)。 現場での選び方の相場感として、月 10 万クエリ未満の小規模用途なら Cohere Rerank API がコスパ最良。大規模・データ秘匿要件があるなら BGE シリーズのローカルモデルを自前運用。AI PICKS が確認した事例では、リランキング導入で回答精度が体感 20〜40% 向上するケースが多く、RAG 精度改善の最初の一手として推奨される。
リランキング (Re-ranking)の使用例
- 社内ナレッジ検索で初回 100 件取得後、Cohere Rerank で上位 5 件に絞り LLM に渡すことで、的外れな回答が大幅に減少した事例。
- Flowise の RAG フローにリランキングノードを追加し設定のみで精度向上を確認。追加コストは月約 3,000 円に収まった。
リランキング (Re-ranking)に関連するAIツール
関連用語
「RAG・検索拡張」の他の用語
Retrieval-Augmented Generation。 社内資料や外部 DB を検索してから AI に答えさせる仕組み。
文章や画像を 数値ベクトルに変換する技術。 類似度検索や RAG の基礎。
出典付きで回答する AI 検索エンジン。 リサーチ業務で従来検索を置き換える。
Google 検索の上位に AI が回答を提示する 「AI Overviews」 や Perplexity 等の新世代検索。
Embedding (数値ベクトル) を高速に類似度検索するための専用 DB。 Pinecone / Qdrant / Weaviate が代表。
NotebookLMとはGoogleが提供するRAGベースのAIリサーチアシスタントのこと。ユーザーがアップロードした文書のみを情報源として回答を生成するため、ハルシネーションを大幅に抑制できる。
AI用語辞典をすべて見てみませんか
12カテゴリ・102語以上を体系的に整理しています
辞典トップへ