オンデバイスAI (On-device AI)
読み: おんでばいすえーあい
最終更新: 2026-06-28・AI PICKS編集部
定義
オンデバイスAIとは、クラウドサーバーへ送信せずデバイス本体(スマートフォン・PC・IoT機器など)上でAIモデルを直接推論・実行する技術のこと。
オンデバイスAI (On-device AI)とは — 詳しく解説
オンデバイスAIは、推論処理をクラウドではなくエンドデバイス側で完結させるアーキテクチャ。プライバシー保護・低レイテンシー・オフライン動作・通信コスト削減が主な利点として挙げられる。 2026年時点では、Apple Silicon(Neural Engine)・Qualcomm Snapdragon NPU・MediaTek DimensityなどのAIアクセラレータが普及し、スマートフォンで7Bクラスのモデルが実用速度で動作するようになった。MicrosoftのCopilot+ PCやGoogleのPixelシリーズがオンデバイス推論を積極的に採用している。 実運用での落とし穴として、①モデルサイズの制約——エッジデバイスのメモリは通常4〜8GBで量子化(INT4/INT8)が必須になるが精度劣化が起きやすい、②デバイス多様性——Android端末だけでもNPU性能差が大きく動作保証の工数が膨らむ、③モデル更新コスト——アプリ更新経由での配布が必要でユーザーのアップデート率に左右される、の3点が現場で頻出する。 現場での選び方の相場感として、LLM APIコールが月数万円を超える案件や医療・金融など機密データを外部送信できない用途でROIが合いやすい。AI PICKSの調査では、2026年現在はオンデバイスとクラウドのハイブリッド構成(軽い処理はデバイス側、複雑な推論はクラウド側)が事例として最も多いパターンとなっている。
オンデバイスAI (On-device AI)の使用例
- スマートフォンのカメラアプリが被写体認識をクラウド送信なしでリアルタイム処理するケースは、典型的なオンデバイスAIの活用例。
- 工場のエッジサーバー上で不良品検知モデルを動かし、ネット接続が不安定な環境でも推論を止めない製造DXの事例が2026年に急増している。
オンデバイスAI (On-device AI)に関連するAIツール
関連用語
「インフラ・学習」の他の用語
既存の AI モデルを 自社データで追加学習させて 専門特化させる方法。
データから法則を自動学習させる AI 技術の総称。 ディープラーニングや LLM もここに含まれる。
ニューラルネットワークを多層化した機械学習手法。 LLM / 画像認識 / 音声認識 の基盤技術。
Self-Attention 機構を中核とするニューラルネット構造。 LLM / 画像 / 音声 すべての基盤。
入力系列のどこに注目すべきかを 動的に重み付けする仕組み。 Transformer の中核。
LoRAとは、大規模モデルの重みを凍結したまま低ランク行列ペアを追加挿入することで、全パラメータの1%以下の計算コストで特定ドメインへの適応を実現するファインチューニング手法のこと。
AI用語辞典をすべて見てみませんか
12カテゴリ・252語以上を体系的に整理しています
辞典トップへ