TPU (テンソル処理ユニット)
読み: てぃーぴーゆー(てんそるしょりゆにっと)
最終更新: 2026-06-30・AI PICKS編集部
定義
TPUとはGoogleが開発したAI・機械学習専用のカスタムチップのこと。行列演算を高速化し、GPU比で数倍〜数十倍のスループットを実現する。
TPU (テンソル処理ユニット)とは — 詳しく解説
TPU(Tensor Processing Unit)はGoogleが2016年に初公開したASIC(特定用途向け集積回路)で、ニューラルネットワークの推論・学習に特化した設計が特徴だ。汎用GPUと異なり行列積演算を回路レベルで最適化しており、LLMや画像生成モデルのトレーニングで圧倒的なコスト効率を発揮する。 2026年時点の実運用では、Google Cloud TPU v5pがフラッグシップ。AI PICKS編集部が現場で把握している相場感として、TPU v5p(単一チップ)は時間あたり約$3〜5で、同世代H100 GPUの約0.6〜0.8倍のコストで2〜3倍のスループットを出せるケースがある。ただしTensorFlow/JAX以外のフレームワーク対応が限定的で、PyTorchユーザーは移植コストが発生する点が落とし穴だ。 選び方の現場ポイントは3つ。①既存コードベースがJAX/TensorFlowならTPU一択。②PyTorchのみなら無理に移行せずH100を使う。③バッチ推論(非リアルタイム)用途ほどTPUのコスパが際立つ。Google Vertex AIやAmazon Bedrockのマネージドサービス経由でTPUバックエンドを間接利用する事例も2026年は急増している。
TPU (テンソル処理ユニット)の使用例
- Google Cloud TPU v5pでLlama 3 70Bをファインチューニングした事例では、A100×8構成比で学習時間が約40%短縮、コストも約25%削減できた。
- バッチ画像生成パイプラインにTPU v4を採用した現場では、1万枚/時の処理をGPU構成の60%のコストで実現している。
TPU (テンソル処理ユニット)に関連するAIツール
関連用語
「インフラ・学習」の他の用語
既存の AI モデルを 自社データで追加学習させて 専門特化させる方法。
データから法則を自動学習させる AI 技術の総称。 ディープラーニングや LLM もここに含まれる。
ニューラルネットワークを多層化した機械学習手法。 LLM / 画像認識 / 音声認識 の基盤技術。
Self-Attention 機構を中核とするニューラルネット構造。 LLM / 画像 / 音声 すべての基盤。
入力系列のどこに注目すべきかを 動的に重み付けする仕組み。 Transformer の中核。
LoRAとは、大規模モデルの重みを凍結したまま低ランク行列ペアを追加挿入することで、全パラメータの1%以下の計算コストで特定ドメインへの適応を実現するファインチューニング手法のこと。
AI用語辞典をすべて見てみませんか
12カテゴリ・352語以上を体系的に整理しています
辞典トップへ