Reka AIとは
Reka AIは、テキスト・画像・動画・音声を1つのプロンプトで横断処理できるマルチモーダル大規模言語モデルを提供する研究系スタートアップです。GoogleとMetaの研究者が立ち上げた組織で、Reka Core・Reka Flashという複数モデルラインを通じて、APIアクセスとオンプレミス/専用クラウドのエンタープライズデプロイを両立しているのが特徴。動画レビューの自動要約、製造業の検査画像の分析、コールセンター音声の構造化など、マルチメディアデータが大量に存在するエンタープライズ業務での活用が想定されます。
主要機能
1. クロスモーダル推論:動画・画像・音声・テキストを同一コンテキストに載せ、「この動画の3分時点で起きた不具合と、添付マニュアルの整合性を検証」といった複合指示に応答。従来の単一モーダルパイプラインで30分以上かかる確認作業が、1プロンプトで数十秒に収束します。
2. 128Kトークンの長文コンテキスト:Reka Coreは128,000トークンの長尺入力に対応。数百ページの技術文書や数時間分の会議録音テキストを丸ごと投入し、横断分析が可能。
3. モデル階層の使い分け:高精度のReka Core($10/百万入力トークン、$25/百万出力トークン)と、軽量で安価なReka Flash($0.80/$2.00)を用途に応じて使い分け、コスト最適化が可能。
4. オンプレミス/専用クラウドデプロイ:機密データをパブリッククラウドに出せない金融・医療・製造業向けに、自社環境内でのモデル稼働を提供。
編集部の検証メモ
公開料金プランと機能要件を比較検討した結果、Reka Coreの$10/$25は同等性能帯のGPT-5クラスやClaude Opusと比較してやや割安〜同等水準。差別化はマルチモーダル統合度の高さと、22名規模で機動的にエンタープライズ要件に対応する体制にあります。動画解析を外注したケースで月50万円規模だった検査業務を、Reka Flashで内製化すれば月数万円規模に圧縮できる試算が成り立ちます。一方、汎用チャット用途ではOpenAI/Anthropicの選択肢が成熟しており、純テキスト業務でわざわざRekaを選ぶ動機は弱め。マルチモーダルの統合処理に特化する組織での投資対効果が際立ちます。
想定ユーザー
動画・画像・音声を扱う製造業の品質管理部門、放送・メディア企業のアーカイブ分析、医療画像と問診テキストを統合したい医療系SaaS、データを外に出せない金融機関のR&D部門に向いています。逆に、純テキストのチャットボット用途のみであれば、より日本語特化された他モデルのほうが扱いやすく、Rekaの強みを活かしきれません。


