過学習 (Overfitting)
読み: かがくしゅう
最終更新: 2026-06-30・AI PICKS編集部
定義
過学習とは、モデルが訓練データに適合しすぎて未知データへの汎化性能が著しく低下する現象のこと。
過学習 (Overfitting)とは — 詳しく解説
過学習(Overfitting)とは、機械学習・深層学習モデルが訓練データのノイズや偏りまで暗記してしまい、実運用で初めて出会うデータに対して性能が大幅に劣化する現象を指す。訓練精度は高くてもテスト精度が低い「精度の乖離」として現れるのが典型的なサイン。 2026年時点の現場では、LLMのファインチューニングコストが下がった分だけ過学習リスクが身近になっている。数百件程度の社内データでフルファインチューニングを試みると、ドメイン外の質問で壊滅的な回答を返すモデルが量産されるのが実情だ。AI PICKSの調査でも「ファインチューニング後に汎用性が落ちた」という声は導入事例の3割超に上る。 対策として現場で定番なのはドロップアウト・正則化(L1/L2)・早期終了(Early Stopping)の組み合わせ。LLMではLoRAやQLoRAで更新パラメータを絞る手法が費用対効果の面で優位に立つ。相場感としてフルFTは数万〜数十万円のGPU費用がかかるのに対し、LoRA系は1/5〜1/10程度で収まるケースが多い。 データ量が少ない場合はファインチューニング自体を避け、RAGやプロンプトエンジニアリングで代替するのが2026年の現場での定石となっている。
過学習 (Overfitting)の使用例
- 社内FAQ100件でLLMをファインチューニングしたら汎用質問の精度が激落ち→過学習の典型例。RAGへの切り替えで解決。
- Early Stoppingを設定せず200エポック回したモデルが訓練精度99%・本番精度60%に。バリデーション損失の監視が必須。
過学習 (Overfitting)に関連するAIツール
関連用語
「インフラ・学習」の他の用語
既存の AI モデルを 自社データで追加学習させて 専門特化させる方法。
データから法則を自動学習させる AI 技術の総称。 ディープラーニングや LLM もここに含まれる。
ニューラルネットワークを多層化した機械学習手法。 LLM / 画像認識 / 音声認識 の基盤技術。
Self-Attention 機構を中核とするニューラルネット構造。 LLM / 画像 / 音声 すべての基盤。
入力系列のどこに注目すべきかを 動的に重み付けする仕組み。 Transformer の中核。
LoRAとは、大規模モデルの重みを凍結したまま低ランク行列ペアを追加挿入することで、全パラメータの1%以下の計算コストで特定ドメインへの適応を実現するファインチューニング手法のこと。
AI用語辞典をすべて見てみませんか
12カテゴリ・352語以上を体系的に整理しています
辞典トップへ