エージェント型RAG (Agentic RAG)
読み: えーじぇんとがたらぐ
最終更新: 2026-06-28・AI PICKS編集部
定義
エージェント型RAGとは、AIエージェントが検索クエリの生成・絞り込み・複数ソースの統合を自律的に判断しながら回答を生成する、従来のRAGを進化させたアーキテクチャのこと。
エージェント型RAG (Agentic RAG)とは — 詳しく解説
従来のRAGは「1回検索→生成」の固定フローだが、エージェント型RAGではLLM自身が検索クエリの生成・言い換え・反復検索の要否・複数ソースの統合を自律判断する。複雑な質問への回答精度は大幅に向上するが、導入コストとのトレードオフが大きい。 2026年時点の実運用での主な落とし穴は3点。①レイテンシ:通常RAGが1〜2秒で返せる場面でもエージェントの反復検索で5〜15秒に膨らむ。②コスト肥大:検索ループが収束せず1クエリで20回以上のLLM呼び出しが発生するケースも珍しくない。③コンテキスト汚染:取得情報が増えるほど無関係な内容が混入し、精度が逆に下がるパラドックスに注意が必要だ。 現場での選び方は明確で、単純なFAQや1ソース参照なら通常のRAGで十分。法律・医療・社内ナレッジの複合推論が必要な場面にのみ採用を検討する。相場感はAmazon Bedrock Agents経由で月$50〜$500程度(クエリ量依存)。AI PICKSで調査した事例では、過剰導入によりコストが通常RAGの10倍に跳ね上がったケースが複数報告されている。
エージェント型RAG (Agentic RAG)の使用例
- 社内規程QAシステムで複数部門のドキュメントを横断検索する際、エージェントが自動でクエリを分割・統合して回答精度を高める。
- 法律相談ボットで判例・法令・通達を多段階で検索し、矛盾する情報を自律的に取捨選択して根拠付き回答を生成する。
エージェント型RAG (Agentic RAG)に関連するAIツール
関連用語
「RAG・検索拡張」の他の用語
Retrieval-Augmented Generation。 社内資料や外部 DB を検索してから AI に答えさせる仕組み。
文章や画像を 数値ベクトルに変換する技術。 類似度検索や RAG の基礎。
出典付きで回答する AI 検索エンジン。 リサーチ業務で従来検索を置き換える。
Google 検索の上位に AI が回答を提示する 「AI Overviews」 や Perplexity 等の新世代検索。
Embedding (数値ベクトル) を高速に類似度検索するための専用 DB。 Pinecone / Qdrant / Weaviate が代表。
NotebookLMとはGoogleが提供するRAGベースのAIリサーチアシスタントのこと。ユーザーがアップロードした文書のみを情報源として回答を生成するため、ハルシネーションを大幅に抑制できる。
AI用語辞典をすべて見てみませんか
12カテゴリ・252語以上を体系的に整理しています
辞典トップへ