AI PICKS
AI用語辞典インフラ・学習

命令チューニング (Instruction Tuning)

読み: めいれいちゅーにんぐ

最終更新: 2026-06-29・AI PICKS編集部

定義

命令チューニングとは、事前学習済みの大規模言語モデルに対して「指示→理想回答」形式のデータで追加学習を行い、ユーザーの指示に従う能力を後付けする手法のこと。

命令チューニング (Instruction Tuning)とは — 詳しく解説

命令チューニング(Instruction Tuning)は、事前学習済みLLMに「人間の指示に従う」能力を与える追加学習手法。「指示→理想回答」のペアデータを大量に学習させることで、曖昧な入力でも意図を汲んだ応答が可能になる。ChatGPTやClaudeの基盤にも採用されており、RLHF(人間のフィードバックによる強化学習)とセットで実装されることが多い。 2026年の実運用で重要なのは「品質 vs 量」のトレードオフだ。現場では粗い数万件より高品質な1,000〜5,000件の指示ペアのほうが出力品質が高いという事例が増えている。AI PICKSが観察した相場感では、外部アノテーション委託の費用は1件50〜300円。日本語特化モデルでは英語データの機械翻訳より母語話者によるオリジナル作成が推奨される。 落とし穴は「カタストロフィック・フォーゲッティング」—元モデルの汎用能力が上書きされて劣化するケース。対策としてLoRAやQLoRAなどPEFT(Parameter-Efficient Fine-Tuning)が現場標準になりつつある。2026年現在、クラウドAPIで技術ハードルは大幅に下がったが、学習データの著作権・個人情報管理は依然として課題だ。

命令チューニング (Instruction Tuning)の使用例

  • ChatGPTやClaudeがユーザーの指示に従って回答できるのは、命令チューニングで「指示を実行する」挙動を学習しているから。
  • 自社ドメイン向けに命令チューニングする際、最低1,000件の高品質な「指示→回答」ペアを用意するのが現場の目安。

命令チューニング (Instruction Tuning)に関連するAIツール

関連用語

インフラ・学習」の他の用語

AI用語辞典をすべて見てみませんか

12カテゴリ・302語以上を体系的に整理しています

辞典トップへ