状態空間モデル (Mamba/SSM)
読み: じょうたいくうかんもでる
最終更新: 2026-06-28・AI PICKS編集部
定義
状態空間モデル(SSM)とは、時系列・シーケンスデータを線形再帰で効率的に処理するための数学的フレームワークのこと。Mambaに代表される実装はTransformerの二次計算コストを回避し、超長文脈処理を低メモリで実現する。
状態空間モデル (Mamba/SSM)とは — 詳しく解説
状態空間モデル(SSM)は制御工学由来のフレームワークで、入力→隠れ状態→出力の線形変換でシーケンスを処理する。2023年にAlbert Guらが発表したMambaはセレクティブSSMを採用し、長さNの系列に対してTransformerのO(N²)を上回るO(N)計算量を実現。100万トークン超の長文脈処理が現実的なコストで可能になった。2026年の実運用における要点は3つ。①相場感:MambaベースモデルはGPUメモリ使用量がTransformer比30〜60%削減できるため、同スペックサーバーでのバッチ処理コストが大幅に改善される。②落とし穴:SSMは構造上「忘却」が起きやすく、超長文脈でも中盤の重要情報を取りこぼすケースがある。現場ではRAGと組み合わせた設計が主流になりつつある。③選び方:チャット・対話用途は依然Transformerが強いが、医療記録・法律文書・コードベース全体の一括処理では2026年時点でMamba系が有力候補。AI PICKSでも主要LLMサービスの基盤アーキテクチャ動向を継続的にウォッチしている。
状態空間モデル (Mamba/SSM)の使用例
- 長文の契約書を一括要約する業務で、Mamba系モデルに切替えたところTransformer比で推論メモリを55%削減できた事例がある。
- SSMベースモデルの実験管理にWeights & Biasesを使うと、長文脈タスクでの性能劣化ポイントを早期に特定しやすい。
状態空間モデル (Mamba/SSM)に関連するAIツール
関連用語
「LLM / 言語モデル」の他の用語
Artificial Intelligence の略。人間の知能をコンピュータで再現する技術全般を指す。
Large Language Model の略。 膨大なテキストで学習した文章生成 AI。 ChatGPT / Claude / Gemini が代表例。
AI がそれっぽい嘘をつく現象。 学習データに無い情報を推測で生成してしまう。
AI が一度に扱える文章の長さ。 トークン数で表現される (例: Claude Opus 4.7 は 1M トークン)。
AI が扱う文字のかたまり。 日本語は 1 文字 ≒ 1 トークン、 英語は単語 ≒ 1 トークン。 料金計算の単位でもある。
文章・画像・音声・動画 を新規に作り出す AI 技術。 ChatGPT 以降の AI ブームの主役。
AI用語辞典をすべて見てみませんか
12カテゴリ・252語以上を体系的に整理しています
辞典トップへ