動画インペインティング (Video Inpainting)
読み: どうがいんぺいんてぃんぐ
最終更新: 2026-06-29・AI PICKS編集部
定義
動画インペインティングとは、動画フレーム内の指定領域を前後フレームの情報をもとに時系列の整合性を保ちながら自動補完・修復するAI技術のこと。不要オブジェクト除去や映像修復に広く使われる。
動画インペインティング (Video Inpainting)とは — 詳しく解説
動画インペインティングは、映像内の特定領域(マスク部分)をディープラーニングで補間し、時系列的に自然な映像を生成する技術だ。静止画インペインティングと異なり、時間軸の一貫性(テンポラル・コヒーレンス)の確保が最大の難点となる。主な用途は①ロゴ・透かし・字幕の除去、②撮影時の不要人物・物体消し、③傷や劣化したフィルムの修復、④カメラフレーム外への映像拡張。2026年現在、ProPainterやE2FGVIといったOSSモデルが品質面で頭ひとつ抜けており、短尺(5〜10秒)・Full HDならほぼ実用レベルに達している。実運用での落とし穴として、①長尺になるほどフレーム境界でテクスチャのちらつきが出やすい、②4K以上はVRAM40GB超が必要でクラウドAPI頼りになる、③マスク生成(どこを消すか)をSAM2などで別途行う必要があり工程が二段階になる点が挙げられる。現場での選択基準は「速さ優先か品質優先か」で決まる。RunwayのEraserなど商用SaaSは数クリックで完結する代わりに1動画あたり数ドル〜十数ドルの相場感。OSSパイプラインは無料だがGPUセットアップと1分動画で数十分の処理時間がコストになる。AI PICKSが調べた事例では、ロゴ除去・短尺案件なら商用APIが費用対効果で優位なケースが多い。
動画インペインティング (Video Inpainting)の使用例
- インタビュー映像の背景に映り込んだ他社ロゴをRunwayのEraserでマスク指定→5秒で除去。前後フレームとのなじみも自然で再撮影不要だった。
- ProPainterで古いフィルム映像のスクラッチノイズを逐次補完。Full HD・30秒素材の処理時間は約20分(RTX 4090使用)。
動画インペインティング (Video Inpainting)に関連するAIツール
関連用語
「動画生成」の他の用語
OpenAI の動画生成 AI。 ChatGPT Pro で利用可能、 最大 20 秒の高品質動画を生成。
プロ向け AI 動画編集・生成スイート。 Gen-3 / Gen-4 で 映画品質の動画を生成。
VeoとはGoogle DeepMindが開発した動画生成AIモデルのこと。テキストプロンプトや静止画から高精細な動画を生成でき、物理的整合性と映像の時間的一貫性においてSoraと並ぶ業界最高水準を誇る。
Kling(可灵)とは、中国の快手(Kuaishou)が開発したAI動画生成モデルのこと。テキストや画像から最大2分・1080pの高品質動画を生成でき、SoraやRunwayと並ぶ有力な動画生成AIとして世界的に注目されている。
PikaとはテキストプロンプトやAI画像を入力するだけで3〜10秒の高品質な短尺動画クリップを自動生成できるAI動画生成プラットフォームのこと。
Luma Dream Machineとは、Luma AIが提供するテキストや画像から高品質な動画クリップを自動生成できるAIビデオ生成ツールのこと。物理的にリアルな映像と滑らかなカメラワークを特徴とする。
AI用語辞典をすべて見てみませんか
12カテゴリ・302語以上を体系的に整理しています
辞典トップへ