Milvusとは

Milvusは10億件規模のベクトル検索を秒単位で処理するオープンソースのベクトルデータベースで、RAG (検索拡張生成) や意味検索、レコメンドエンジンの基盤として採用が広がっています。テキスト・画像・音声を埋め込みベクトルとして保存し、コサイン類似度や内積で意味的に近いデータを抽出。LLMアプリの「記憶層」を内製化したい機械学習エンジニア、AIスタートアップのインフラ担当、社内ナレッジ検索を構築する情シス向けに設計されています。

主要機能

1. 10億ベクトル級の分散検索: ストレージ・クエリ・インデックスを分離したクラウドネイティブ構成で、ノード追加だけで水平スケール。従来RDBで数十秒かかっていた類似検索を数十ミリ秒に短縮できます。2. 11種類のインデックス選択: HNSW、IVF_FLAT、DiskANN、GPU_CAGRAなどをデータ量と精度要件に応じて切替可能。Milvus 2.1以降は同時実行スケジューラとコスト評価モデルでCPU効率を最適化。3. ハイブリッド検索: ベクトル類似度に加えメタデータでのフィルタリング (スカラー検索) を同一クエリで実行でき、業種・日付・ユーザー属性を絡めた絞り込みが可能。4. Zilliz Cloud (マネージド版): 自己ホストの運用負荷を避けたい場合、AWS / GCP / Azure上のフルマネージド版を従量課金で利用可能。

編集部の検証メモ

公開ドキュメントとSizing Toolで必要リソースを試算したところ、1億ベクトル (768次元) の場合Milvusセルフホストはメモリ32-64GBのノード3台構成で月インフラ費$300-600程度に収まり、Pineconeの同等プラン (月$700-) より 30-50%安い試算になります。一方でKubernetes運用が必要なため、人件費を含めると小規模案件では Zilliz Cloud (Serverless月$0.10/100万クエリ〜) の方がTCOで有利。Milvus公式ドキュメントの比較表でもPineconeより柔軟なインデックス選択とGPU対応が差別化ポイントとして挙げられており、PoCで1日かかっていたインデックス再構築が分単位に短縮された事例が報告されています。

想定ユーザー

向いているのは、10万件以上のベクトルを扱うRAG・意味検索を本番運用したいMLエンジニアと、データ主権・コスト最適化のためにベクトルDBを内製化したい企業のインフラチームです。逆に、検索対象が数万件以下のプロトタイプや、運用担当者が不在のチームにはZilliz Cloudかpgvectorの方が学習コスト的に現実的です。