テンポラル一貫性 (Temporal Consistency)
読み: てんぽらるいっかんせい
最終更新: 2026-06-28・AI PICKS編集部
定義
テンポラル一貫性とは、AI動画生成において隣接するフレーム間で被写体・背景・照明などの視覚要素が矛盾なく保たれる性質のこと。
テンポラル一貫性 (Temporal Consistency)とは — 詳しく解説
テンポラル一貫性(Temporal Consistency)は動画生成AIにおける品質指標のひとつで、フレームをまたいで被写体の形状・テクスチャ・色調・照明が安定していることを指す。一貫性が崩れると「フリッカリング」「ゴースティング」「キャラクター崩壊」が発生し、視聴者に強い違和感を与える。 拡散モデルベースの動画生成はフレームを独立して生成する設計が多く、テンポラル一貫性の確保が最大の技術課題だった。2026年現在、Sora・Hailuo AI・Runway Gen-4などが時系列方向のアテンション機構を強化し、短尺(5〜10秒)であれば高水準の一貫性を実現するモデルが実用化されている。 AI PICKS編集部の実運用検証では、長尺(30秒超)になると中盤以降でキャラクターの顔・衣装が微妙に変化するケースが多い。特に複雑な動きや光源変化を含むシーンで顕著。現場での回避策は①短いクリップを繋ぐ分割生成、②キーフレーム固定のimg2video手法、③ControlNetで一貫性を強制する方法が主流。 2026年の相場感として、一貫性の高いモデルはAPI課金が高く、10秒クリップ1本あたり$0.5〜$2程度。広告制作で大量生成する場合は月コストが数万円規模になることも。用途と予算に応じてモデルを使い分けるのが現場の正解。
テンポラル一貫性 (Temporal Consistency)の使用例
- 「青いドレスの女性が歩く」と指定しても、フレームが進むにつれドレスが緑に変色したり人物の顔が変わる現象がテンポラル一貫性の破綻の典型例。
- img2video機能でキーフレームを1枚固定し被写体の外観をモデルに記憶させる手法は、広告動画制作の現場でデファクトスタンダードになりつつある。
テンポラル一貫性 (Temporal Consistency)に関連するAIツール
関連用語
「動画生成」の他の用語
OpenAI の動画生成 AI。 ChatGPT Pro で利用可能、 最大 20 秒の高品質動画を生成。
プロ向け AI 動画編集・生成スイート。 Gen-3 / Gen-4 で 映画品質の動画を生成。
VeoとはGoogle DeepMindが開発した動画生成AIモデルのこと。テキストプロンプトや静止画から高精細な動画を生成でき、物理的整合性と映像の時間的一貫性においてSoraと並ぶ業界最高水準を誇る。
Kling(可灵)とは、中国の快手(Kuaishou)が開発したAI動画生成モデルのこと。テキストや画像から最大2分・1080pの高品質動画を生成でき、SoraやRunwayと並ぶ有力な動画生成AIとして世界的に注目されている。
PikaとはテキストプロンプトやAI画像を入力するだけで3〜10秒の高品質な短尺動画クリップを自動生成できるAI動画生成プラットフォームのこと。
Luma Dream Machineとは、Luma AIが提供するテキストや画像から高品質な動画クリップを自動生成できるAIビデオ生成ツールのこと。物理的にリアルな映像と滑らかなカメラワークを特徴とする。
AI用語辞典をすべて見てみませんか
12カテゴリ・252語以上を体系的に整理しています
辞典トップへ