Llama (Meta)
読み: らま
最終更新: 2026-06-29・AI PICKS編集部
定義
LlamaとはMetaが開発・無償公開するオープンウェイトの大規模言語モデルシリーズのこと。自社サーバーやローカル環境で動作し、データを外部に送らずにLLMを活用できる唯一に近い選択肢。
Llama (Meta)とは — 詳しく解説
MetaがオープンウェイトとしてリリースするLLMファミリー。Llama 2(2023年7月)から商用ライセンスが解放され、Llama 3(2024年)以降は多言語・推論能力が大幅に向上した。2026年現在はLlama 4が最新で、マルチモーダルと数百万トークン規模の長コンテキストに対応する。 最大の強みは「自社インフラで完結できること」。医療・金融・法務などデータを外部に出せない現場では、OpenAIやAnthropicのAPIを選べないケースでLlamaがデファクト候補になっている。GPU付きサーバー1台(AWS g4dn.xlarge 換算で月5〜7万円前後)で70Bモデルが稼働でき、月数千リクエスト規模なら自前推論がAPIより割安になる相場感がある。 実運用での落とし穴は量子化精度の劣化。VRAMを節約するQ4量子化はコーディングや長文推論でGPT-4o比20〜30%精度が落ちるケースがある。短文FAQ・RAG・分類など単純タスクに向き、複雑なエージェント処理には上位クラウドモデルとの使い分けが現場セオリー。AI PICKSでも「クラウド不要で動くLLM」の代表として位置づけており、HuggingFaceに数万種の派生・ファインチューニング済みモデルが公開されている点も選定の後押しになる。
Llama (Meta)の使用例
- Ollama + Llama 3でローカルRAGを構築。社内文書を外部に送らず社員が自然言語検索できる環境を低コストで実現した法律事務所の事例。
- Llama 3.1 70BをLoRAでファインチューニングし、ECサイトの商品説明生成を自動化。GPT-4o比でAPIコストを約90%削減した国内EC企業の事例。
Llama (Meta)に関連するAIツール
関連用語
「LLM / 言語モデル」の他の用語
Artificial Intelligence の略。人間の知能をコンピュータで再現する技術全般を指す。
Large Language Model の略。 膨大なテキストで学習した文章生成 AI。 ChatGPT / Claude / Gemini が代表例。
AI がそれっぽい嘘をつく現象。 学習データに無い情報を推測で生成してしまう。
AI が一度に扱える文章の長さ。 トークン数で表現される (例: Claude Opus 4.7 は 1M トークン)。
AI が扱う文字のかたまり。 日本語は 1 文字 ≒ 1 トークン、 英語は単語 ≒ 1 トークン。 料金計算の単位でもある。
文章・画像・音声・動画 を新規に作り出す AI 技術。 ChatGPT 以降の AI ブームの主役。
AI用語辞典をすべて見てみませんか
12カテゴリ・302語以上を体系的に整理しています
辞典トップへ