
ComfyUIの使い方完全ガイド|導入から画像生成・拡張まで
この記事のポイント ComfyUIは、Stable Diffusionをノードでつないで操作する無料のローカル生成ツール。スライダーをいじるWebUIとは設計思想が違い、生成の「配線」を自分で組む。 2026年2月時点でDesktop版が正式リリースされ、AMD GPUとApple Siliconにも対応。画像だけでなく動画・音声・3Dまで一つの画面で扱える統合プラットフォームに育った。 この記事は、インストールでつまずく所、最初のtxt2imgワークフロー、img2img、拡張機能の入れ方、商用利用の線引きまで、手を動かす順番で並べた実用ガイドだ。
ComfyUIの第一印象は、たいてい「難しそう」で終わる。画面いっぱいに四角いノードと配線が走り、Automatic1111のようなフォーム型UIに慣れた人ほど面食らう。
でも、この配線こそが価値だ。生成のどの工程に何を差し込むかを完全に握れる。一度組んだ流れは「ワークフロー」として保存・共有でき、同じ品質を再現できる。WebUIで「なぜか今日は綺麗に出ない」が起きにくい。
ComfyUIとは、Stable Diffusionの画像生成プロセスをノードベースで視覚的に構築するGUIツールだ。ノードを接続しパラメータを調整することで、柔軟で高度な生成を組み立てられる(出典: AI総合研究所)。
ComfyUIとは何か、なぜ選ばれるのか

ComfyUIは、Stable Diffusion系モデルを操作するためのノードベースGUI。テキストから画像(txt2img)、画像から画像(img2img)を、処理の流れを目で見ながら作る。
オープンソースで拡張性が高く、初心者から上級者まで自由度の高い生成ができる(出典: ComfyUI解説記事)。最大の特徴は、生成パイプラインの一つひとつが独立したノードとして可視化される点だ。
なぜ選ばれるのか。理由は3つに集約できる。
- 完全ローカルで動き、テレメトリがなく外部に画像が出ない
- ワークフローをJSON/画像として保存・配布でき、再現性が高い
- 最新モデルへの対応が速く、動画・音声・3Dまで守備範囲が広い
逆に言えば、「とりあえず1枚出したいだけ」の人には過剰だ。そこは正直に向き不向きがある。
ComfyUIとAutomatic1111の違いを詳しく知りたいなら、ComfyUIとStable Diffusionの違いも合わせて読むと整理しやすい。
ComfyUIとStable Diffusion、WebUIとの違いは?

混同されやすいが、Stable Diffusionは「画像を生成するモデル(エンジン)」、ComfyUIはそれを「動かすための操作画面」だ。エンジンは共通で、運転席が違うと考えればいい。
下の表は、代表的な操作環境の立ち位置を整理したもの。同じStable Diffusionを動かしても、設計思想がここまで違う。
| 項目 | ComfyUI | Automatic1111 (WebUI) |
|---|---|---|
| UI形式 | ノードベース(配線) | フォーム/スライダー |
| 学習コスト | 高め | 低め |
| 再現性 | 高い(ワークフロー保存) | 設定の手動再現 |
| 細かい制御 | 圧倒的に自由 | 標準機能の範囲 |
| 動画・3D生成 | 対応(拡張で拡大) | 限定的 |
ComfyUIはグラフィックノードエディタとして、最先端の柔軟性を前面に押し出す設計になっている(出典: MimicPC比較記事)。一方Automatic1111は、開いてすぐ生成できる手軽さで初心者に強い。
結論はシンプルだ。手軽さ優先ならWebUI、制御と再現性を取るならComfyUI。両方触って自分の用途で決めるのが一番早い。
ComfyUIの動作環境とGPU要件

ComfyUIはローカルGPUで動く。ここが快適さの分かれ目になる。
2026年2月時点で、NVIDIAに加えてAMD GPU(ROCm)やApple Siliconにも対応し、NVIDIA以外の環境でも現実的な選択肢になった(出典: AI総合研究所)。以前は実質NVIDIA一択だった時代を思えば、これは地味に大きい。
環境別の目安を表にした。VRAMが生成速度と扱えるモデルサイズを左右する。
| 環境 | 対応 | 体感の目安 |
|---|---|---|
| NVIDIA(VRAM 8GB+) | ◎ | 最も安定・高速 |
| AMD GPU(ROCm) | ○ | Linux中心、設定に手間 |
| Apple Silicon(M系) | ○ | 動くが大型モデルは重い |
| クラウドGPU | ◎ | 初期費ゼロ、従量課金 |
手元のマシンが非力でも諦めなくていい。クラウドGPU上でComfyUIを動かすサービスを使えば、ブラウザだけで重いワークフローを回せる。ローカルにこだわらない選択肢が2026年は当たり前になった。
Desktop版とポータブル版、どっちで入れる?

導入経路は主に3つ。Desktop版、ポータブル版(ZIP展開)、手動インストール(Git)だ。
2026年2月時点でDesktop版が正式リリースされ、インストーラ形式で導入のハードルが大きく下がった(出典: AI総合研究所)。「まず触りたい」人はDesktop版で間違いない。
選び方を整理する。
- Desktop版: インストーラで完結。アップデートも楽。初心者の第一候補
- ポータブル版: ZIPを展開するだけ。複数バージョンを併存させたい人向け
- 手動(Git): 最新の開発版を追える。拡張やトラブル解決に強い上級者向け
迷ったらDesktop版で始めて、物足りなくなったらポータブルや手動に移行すればいい。最初から手動を選んで環境構築で消耗するのは、正直イマイチな入り方だ。
ComfyUIのインストール手順(Desktop版)
ここからは実際の導入。Desktop版を前提に、つまずきやすい順に並べる。
大まかな流れは、インストーラ取得 → 起動 → モデル(チェックポイント)配置 → 初回生成、の4段階。モデルファイルの置き場所さえ間違えなければ、最初の1枚まではすぐ届く。
- 公式サイトからDesktop版インストーラをダウンロードして実行する
- 起動後、モデル(
.safetensors)を所定のmodelsフォルダに置く - ブラウザ/アプリ上でデフォルトワークフローを読み込む
- プロンプトを入力して「Queue(実行)」を押す
最初に必要なのはチェックポイントモデル1つ。これが無いと、配線が正しくても画像は出ない。ここで止まる初心者が一番多い。
モデルは生成の「画風と知識」を決める核だ。リアル系、アニメ系で別物になるので、目的に合うものを最初に1つ用意しておく。
最初のワークフロー:txt2imgの組み方
ComfyUIを開くと、デフォルトでtxt2imgのワークフローが最初から組まれている。まずはこれを理解するのが近道だ。
txt2img(テキストから画像生成)は、ComfyUIの基本かつ最重要の使い方だ(出典: AI総合研究所)。標準ワークフローは、おおむね次のノードで構成される。
| ノード | 役割 |
|---|---|
| Load Checkpoint | 使うモデルを読み込む |
| CLIP Text Encode | プロンプト(肯定/否定)を変換 |
| KSampler | ノイズ除去で画像を生成 |
| VAE Decode | 内部データを画像に変換 |
| Save Image | 結果を保存 |
この5ノードが配線でつながっている。プロンプトを書き換えてQueueを押すだけで、最初の1枚が出る。
慣れてきたら、KSamplerのstepsやCFG、サンプラー種別をいじる。数値を変えると絵がどう動くかが、ノードの矢印を追うと直感的に分かる。これがWebUIには無い学びの速さだ。
img2imgとinpaintで既存画像を加工する
txt2imgの次に覚えたいのがimg2img。手持ちの画像を下敷きにして、画風変換や部分修正をする使い方だ。
img2imgは、既存画像を入力にして別の画像へ変換する実践的な機能として位置づけられている(出典: AI総合研究所)。txt2imgのワークフローに「Load Image」ノードを足し、KSamplerのdenoise値を下げるのが基本形になる。
- img2img: 元画像の構図を残しつつ画風を変える。denoiseで「どれだけ元を残すか」を調整
- inpaint: マスクで指定した部分だけ描き直す。服や背景の差し替えに重宝する
- outpaint: 画像の外側を生成して拡張する。トリミングのやり直しに効く
denoiseの数値感覚さえ掴めば、img2imgは一気に実用的になる。0.3なら微修正、0.7なら大胆な作り替え、くらいの肌感で覚えておくといい。
拡張機能で機能を増やす(ComfyUI Manager)
ComfyUIの真価は拡張機能で開放される。標準のままでも生成はできるが、ControlNetやアップスケール、動画生成は拡張を入れてこそだ。
拡張機能の導入を一元管理できるマネージャー系の仕組みを使うと、ノード追加が一気に楽になる。検索して入れて再起動、の流れで機能が増える。
代表的な拡張カテゴリを挙げる。
- ControlNet系: ポーズや線画で構図を厳密に指定する
- アップスケール系: 生成画像を高解像度・高画質化する
- 動画生成系: 連続フレームを生成して動画化する
- ユーティリティ系: ノード整理・プレビュー強化など作業効率を上げる
注意点が一つ。拡張を入れすぎると依存関係が壊れて起動しなくなることがある。必要なものを少しずつ、が鉄則だ。ここを雑にやると週末が溶ける。
ComfyUIで動画・音声・3Dまで作れるって本当?
本当だ。ComfyUIはもう「画像だけのツール」ではない。
2026年2月時点で、ComfyUIは画像生成だけでなく動画・音声生成にも対応する統合的なAI生成プラットフォームへ進化している(出典: AI総合研究所)。さらに3D生成にも対応し、Tripo系の3Dワークフローが使えるとする比較情報もある(出典: SAKASA AI)。
つまり、一つの画面で生成メディアを横断できる。画像で作ったキャラクターを動かし、声を当て、3Dに起こす——という流れがノードでつながる。
ただし動画・3Dは画像よりはるかに重い。VRAMと生成時間の壁が一気に立ちはだかる。最初は静止画で操作に慣れ、メディア拡張は段階的に触るのが現実的だ。
動画生成そのものに興味があるなら、Sora完全ガイドで別系統のツールとも比較しておくと選択肢が広がる。
ワークフローの保存・共有・再利用
ComfyUIの強さは再現性にある。組んだ配線を丸ごと残せるからだ。
ワークフローはJSONとして書き出せるほか、生成したPNG画像の中にワークフロー情報が埋め込まれる。つまり、誰かが共有した1枚の画像をドラッグするだけで、そのままの配線が自分の画面に復元される。
これが効くのは次のような場面だ。
- 上手くいった設定を保存して、いつでも同じ品質を再現する
- チームで配線を共有し、属人化を防ぐ
- 海外コミュニティの高度なワークフローを取り込んで学ぶ
「再現できる」というのは制作現場では破格の価値だ。WebUIの「あの時の設定どうだっけ」問題から解放される。
ComfyUIの料金と商用利用の線引き
ComfyUI本体は完全無料のオープンソースだ。テレメトリも無く、ローカルで完結する(出典: 海外レビュー記事)。ここはクラウド型生成サービスと決定的に違う。
ただし「無料=何でも商用OK」ではない。線引きは本体ではなくモデル側にある。
| 対象 | 商用利用 |
|---|---|
| ComfyUI本体 | 可(オープンソース) |
| チェックポイントモデル | 各モデルのライセンス次第 |
| LoRA・拡張ノード | 配布元の規約次第 |
| クラウドGPU実行 | サービス利用規約に従う |
実務上の急所は、使うモデルとLoRAのライセンス確認だ。商用配布を禁じるモデルで作った画像を売る、といった事故はここで起きる。生成前にライセンスを読む癖をつけたい。
ComfyUIが向いている人・向いていない人
道具に善し悪しはない。合うかどうかだ。ComfyUIは万人向けではない。
向いているのは、生成を細かく制御したい人、同じ品質を量産したい人、最新モデルや動画・3Dまで追いかけたい人。配線を組む手間を「投資」と捉えられるタイプだ。
向いていないのは、月に数枚を手軽に出したいだけの人。その用途ならフォーム型WebUIやクラウド生成サービスの方が圧倒的に速い。
| 用途 | おすすめ |
|---|---|
| 細かい制御・量産 | ComfyUI一択 |
| とりあえず手軽に1枚 | WebUI/クラウド型 |
| 動画・3Dまで統合運用 | ComfyUI |
| スマホで完結したい | クラウド型サービス |
自分がどちら側かを正直に見極めてから入ると、無駄な遠回りをしなくて済む。
実際に使っている企業・チーム
ComfyUIは特定企業の囲い込み製品ではなく、オープンソースのエコシステムとして使われている。公開情報から見える実在の担い手を挙げる。
- Comfy Org(ComfyUI開発元): ComfyUI本体とDesktop版を開発・配布する主体。Desktop版の正式リリースやAMD GPU対応を進めている(出典: AI総合研究所)
- Stability AIのStable Diffusionエコシステム: ComfyUIが操作対象とするStable Diffusion系モデルの供給元。ComfyUIはこのモデル群を前提に成り立つ(出典: 各解説記事)
- クラウドGPU実行サービス群(MimicPC等): ComfyUIをブラウザ上で動かす環境を提供し、ローカルGPUを持たないユーザーの実運用を支えている(出典: MimicPC比較記事)
いずれも具体的な社内事例の数値までは公開情報で確認できないため、ここでは公に観測できる役割の範囲にとどめる。誇張した導入事例は書かない。
ComfyUIと他ツールの使い分け
ComfyUIに全部寄せる必要はない。タスクごとに最適な道具は違う。
たとえば検索・リサーチ用途ならFelo完全ガイド、汎用アシスタント用途ならMeta AIガイド、文書のデジタル化ならAI OCRツールガイド、といった具合に役割が分かれる。
画像生成という同じ土俵でも、制御性のComfyUIと手軽さのクラウド型は補完関係にある。ラフ出しはクラウドで速く、本番量産はComfyUIで再現性高く、という二段構えが実務では強い。
道具を一つに絞ろうとしないこと。これがAI制作で消耗しないコツだ。
ComfyUIを使い始める最短ロードマップ
最後に、迷わないための順番を一本道にまとめる。あれこれ手を出す前に、この順で進めれば最短で「使える」状態に届く。
- Desktop版をインストールしてチェックポイントを1つ置く
- デフォルトのtxt2imgワークフローで1枚生成する
- KSamplerのstep/CFGをいじって変化を観察する
- img2imgを足して既存画像の加工を試す
- 拡張を1つだけ入れて、ControlNetかアップスケールを体験する
ここまで来れば、もうComfyUIの世界観は掴めている。あとは作りたいものに合わせて配線を増やすだけだ。一気に全部覚えようとしないのが、結局いちばん速い。
AI PICKS編集部の判定
ComfyUIは、画像生成を「道具」から「制作環境」に引き上げる存在だ。Automatic1111が自転車なら、ComfyUIはマニュアル車。最初は面倒でも、握れる制御の幅がまるで違う。
2026年に入ってDesktop版が正式化し、AMDとApple Siliconに対応し、動画・音声・3Dまで一画面で扱えるようになった点を、編集部は高く評価する。これはもう単機能ツールではなく、生成メディアの統合ハブだ。無料・ローカル・テレメトリなしという三拍子も、商用制作で外部に画像を出したくない現場に刺さる。
一方で、学習コストの高さは事実として認める。「とりあえず1枚」の人には過剰で、そこはクラウド型やWebUIに譲るべきだ。ComfyUIの真価は、同じ品質を再現したい・細かく作り込みたい・最新モデルを誰より早く触りたい、という明確な動機がある人にだけ開く。
総じて、本気で生成AI制作に踏み込むなら一度は通るべき環境、というのが編集部の結論だ。万人向けではないが、刺さる人には他に代えがたい。
編集部の利用レポート
率直に言うと、初日は配線の海で軽く溺れた。ノードの意味が分からないうちは、エラーが出ても原因の切り分けすらできない。ここで脱落する人の気持ちはよく分かる。
ただ、txt2imgの5ノードの役割を理解した瞬間に景色が変わった。「画像が出る理由」が見えるツールは他にない。WebUIで起きていた「なぜか綺麗に出ない」が、ComfyUIでは配線を追えば説明がつく。この透明さは手放せない。
不満も正直に書く。拡張の依存衝突で起動しなくなる事故は地味にストレスだ。動画・3Dは重く、非力なGPUだと待ち時間で心が折れる。ここは環境への投資が前提になる。
総評は「制御性は圧倒的、手軽さは微妙」。用途がハマれば一択、ハマらなければ過剰。評価がここまで二極化するツールも珍しい。
よくある質問(FAQ)
Q. ComfyUIは無料で使えますか?
本体は完全無料のオープンソースだ。テレメトリも無くローカルで完結する(出典: 海外レビュー記事)。ローカルGPUがあれば追加費用ゼロで全機能を使える。クラウドGPUで動かす場合のみ、その実行費用がかかる。
Q. プログラミングの知識は必要ですか?
不要だ。ノードは配線でつなぐ視覚操作で、コードは書かない。ただし各ノードの役割を理解する学習は必要になる。プログラミングというより「配線パズル」に近い感覚だ。
Q. NVIDIA以外のGPUでも動きますか?
動く。2026年2月時点でAMD GPU(ROCm)とApple Siliconに対応している(出典: AI総合研究所)。ただしNVIDIA環境が最も安定・高速なのは変わらない。
Q. Automatic1111とどちらを使うべきですか?
手軽さ重視ならAutomatic1111、制御性と再現性重視ならComfyUIだ。ComfyUIはグラフィックノードエディタとして高い柔軟性を持つ(出典: MimicPC)。両方試して用途で選ぶのが確実だ。
Q. 生成した画像は商用利用できますか?
本体はオープンソースで商用可だが、最終的な可否は使ったモデルとLoRAのライセンスに従う。商用配布を禁じるモデルもあるため、生成前にライセンス確認が必須だ。
Q. 動画や3Dも作れますか?
作れる。ComfyUIは画像に加え動画・音声生成へ対応した統合プラットフォームに進化しており(出典: AI総合研究所)、3D生成にも対応するとされる(出典: SAKASA AI)。ただし画像より重く、相応のGPUが要る。
Q. インストールが難しそうですが初心者でも大丈夫?
Desktop版の正式リリースで導入難易度は大きく下がった(出典: AI総合研究所)。インストーラで入れてモデルを1つ置けば、最初の生成まで届く。最初から手動Gitインストールを選ばないのがコツだ。
関連する比較・代替を見る
- ComfyUI vs Stable Diffusion
- ComfyUIの代替ツールを見る
- ComfyUI vs Automatic1111
- Stable Diffusionの代替ツールを見る
- ComfyUI vs Midjourney
参考にした一次情報
- ComfyUIとは?導入方法や使い方、拡張機能について解説!(AI総合研究所)
- ComfyUIとは?使い方・モデル・テンプレート・基本機能を解説【2026年版】(SAKASA AI)
- ComfyUI創造力爆発ブラウザ対応で進化した拡張機能と始め方(WEEL)
- An introduction to ComfyUI for absolute beginners!(YouTube解説)
- ComfyUIとは?使い方や導入メリット・商用利用について解説
- Comfyui Review 2026 - Updated Features, Pricing & Verdict
- Compare ComfyUI vs. Stable Diffusion in 2026
- Comfy UI vs Automatic1111 WebUI: A Comprehensive Comparison(MimicPC)
