マルチショット生成 (Multi-shot Generation)
読み: まるちしょっとせいせい
最終更新: 2026-06-28・AI PICKS編集部
定義
マルチショット生成とは、1回の生成プロセスで複数のカメラショット(場面転換)を含む動画を、キャラクターや背景の一貫性を保ちながら連続して出力する技術のこと。
マルチショット生成 (Multi-shot Generation)とは — 詳しく解説
マルチショット生成とは、単一または連続したプロンプト入力で、複数のカメラアングル・シーンで構成された動画を視覚的整合性を維持しながら生成する技術を指す。従来の動画AIは1ショット(固定アングル数秒)の出力が主流だったが、2025〜2026年にかけてSoraやRunwayなど主要プラットフォームがマルチショット対応を本格化した。 2026年の実運用における最大の落とし穴は、ショット間の「整合性崩壊」だ。特に同一キャラクターが複数ショットに登場する場合、顔・服装・照明が別人化・変化する問題が頻発し、後処理コストが膨らむ事例が多い。現場での選び方としては、consistency scoreを公表しているサービスを優先し、本番前に複数回テスト生成で品質を確認する手順が定着しつつある。 相場感は1生成あたり$0.5〜$5程度が一般的で、商用クオリティを求める場合はアップスケール費用が加算される。AI PICKSで収集したユーザーの声では、「ワンショット×複数生成→ポスプロ結合」のほうがコストと品質の両面で安定するという意見も根強く、用途に応じた使い分けが重要だ。
マルチショット生成 (Multi-shot Generation)の使用例
- 「主人公がカフェに入店→商品を手に取る→レジで支払う」の3ショット構成プロモ動画を、キャラクター整合性を維持したまま一括生成する。
- プロンプト例:「Shot1: 女性がオフィスで資料確認。Shot2: 同じ女性が会議室でプレゼン。同一衣装・照明で生成」
マルチショット生成 (Multi-shot Generation)に関連するAIツール
関連用語
「動画生成」の他の用語
OpenAI の動画生成 AI。 ChatGPT Pro で利用可能、 最大 20 秒の高品質動画を生成。
プロ向け AI 動画編集・生成スイート。 Gen-3 / Gen-4 で 映画品質の動画を生成。
VeoとはGoogle DeepMindが開発した動画生成AIモデルのこと。テキストプロンプトや静止画から高精細な動画を生成でき、物理的整合性と映像の時間的一貫性においてSoraと並ぶ業界最高水準を誇る。
Kling(可灵)とは、中国の快手(Kuaishou)が開発したAI動画生成モデルのこと。テキストや画像から最大2分・1080pの高品質動画を生成でき、SoraやRunwayと並ぶ有力な動画生成AIとして世界的に注目されている。
PikaとはテキストプロンプトやAI画像を入力するだけで3〜10秒の高品質な短尺動画クリップを自動生成できるAI動画生成プラットフォームのこと。
Luma Dream Machineとは、Luma AIが提供するテキストや画像から高品質な動画クリップを自動生成できるAIビデオ生成ツールのこと。物理的にリアルな映像と滑らかなカメラワークを特徴とする。
AI用語辞典をすべて見てみませんか
12カテゴリ・252語以上を体系的に整理しています
辞典トップへ