
文字起こしAI無料おすすめ11選 — 料金・精度・話者分離で選ぶ正解ガイド
この記事のポイント 無料で使える文字起こしAIは「完全無料」と「無料枠つき有料」の2種類があり、選び方を間違えると途中で課金の壁にぶつかる。日本語の議事録ならNotta、長尺の取材や講演ならOpenAI Whisperのローカル実行、Web会議の自動参加ならtl;dvが軸になる。本記事は無料枠の上限・日本語精度・話者分離の有無を実数で比較し、用途別に「これ一択」を提示する。
無料の文字起こしAIで一番損をするのは、無料枠の「時間上限」を見ずに選ぶことだ。多くのツールは月1〜2時間で頭打ちになる。長尺をタダで回したいならローカル実行型、会議の議事録なら無料枠つきクラウド型——出口は最初から分かれている。
文字起こしAIとは、音声や動画の発話をAIの音声認識で自動的にテキスト化する技術のこと。2026年は単なる書き起こしを超え、要約・話者分離・議事録フォーマット化までを一気通貫でこなす「AI議事録」が標準になった(出典: 吉和の森2026年版比較)。
ここで重要なのは、無料の中身がツールごとに別物だという事実。永久に0円で使えるものもあれば、有料プランの体験版として無料枠を切っているものもある。混同すると「思ったより早く課金された」となる。
無料の文字起こしAIは結局どれが一番おすすめ?
用途を3つに割れば答えはほぼ決まる。会議・打ち合わせの議事録ならNotta、長尺の取材や講演をコスト0で回すならOpenAI Whisperのローカル実行、Web会議への自動参加と録画ならtl;dv。この3本で大半のニーズは埋まる。
「全部入りで1本だけ選べ」と言われたらNottaが無難だ。フリープランが0円で存在し、日本語の議事録精度・話者分離・要約のバランスが破格にいい。ただし無料枠は時間制限があるため、ヘビーに使うなら最初から有料前提で考えるのが正直なところ。
逆に「絶対にお金をかけたくない」「機密音声を外に出したくない」なら、Whisperのローカル実行が圧倒的だ。完全無料・完全オフライン・時間無制限という三拍子は、有料クラウドにない強み。代わりにセットアップの手間と、GPUがないと長尺で時間がかかる弱点を飲む必要がある。
下の表で全体像をつかんでほしい。
| ツール | 無料枠 | 日本語精度 | 話者分離 | 向いている用途 |
|---|---|---|---|---|
| Notta | フリー0円(時間制限あり) | 高 | あり | 会議議事録・商談 |
| OpenAI Whisper | 完全無料(OSS) | 高 | 別途要設定 | 長尺取材・機密音声 |
| 文字起こしさん | 無料枠あり | 中〜高 | 一部 | 字幕・外国語 |
| tl;dv | 無料プランあり | 中〜高 | あり | Web会議の自動録画 |
| Rimo Voice | 無料トライアル | 高 | あり | 日本語会議・インタビュー |
| PLAUD NOTE | デバイス購入+無料AI枠 | 高 | あり | 対面会議・録音 |
表の通り「無料」の意味はバラバラ。完全無料はWhisperと文字起こしさんの一部機能、残りは無料枠つきの有料サービスだ。
そもそも文字起こしAIで何が変わる?
手作業の書き起こしは1時間の音声に対して4〜5時間かかると言われてきた。AIはこれを実時間に近い処理に圧縮する。記録・字幕作成・議事録のような定型作業の手間を大幅に削れるのが本質だ(出典: ABKSS AI文字起こしツール解説)。
変わるのは時間だけじゃない。検索性が効く。長時間の会議や講演をテキストで残せば、後から「あの発言どこだっけ」を一瞬で引ける。音声のまま残すと再生して探すしかないが、テキストなら全文検索が走る。
そして2026年型のツールは「理解」まで踏み込む。AIが会議の要点を抽出し、決定事項とToDoを分けて議事録にまとめる。単なる文字の羅列から、読める議事録への跳躍が起きている。
ここはAI全般の進化と地続きで、検索や調査をAIに任せる流れと同じ方向を向いている。AI検索の使いこなしはFeloの完全ガイドでも触れているので、文字起こしと合わせて作業全体を自動化したい人は参照してほしい。
無料と有料で精度はどれくらい違う?
結論から外すと、無料だから精度が低いわけではない。WhisperのようなOSSは無料でありながら、有料クラウドと同等以上の認識精度を出す。差が出るのは精度そのものより「話者分離・要約・連携・サポート」といった周辺機能だ。
無料枠つきサービスの場合、無料と有料で音声認識エンジン自体は同じことが多い。違うのは月間の処理時間上限、要約回数、エクスポート形式、チームでの共有機能。つまり精度の壁ではなく「量と運用」の壁。
正直に言えば、個人が週に数回の会議を文字起こしする程度なら無料枠で十分足りる。毎日何時間も回す、チームで共有する、専門用語辞書を育てる——この段階に来て初めて有料の価値が立ち上がる。
下に無料枠と有料の典型的な差を整理した。
| 比較軸 | 無料枠 | 有料プラン |
|---|---|---|
| 月間処理時間 | 数十分〜数時間で上限 | 数十時間〜無制限 |
| 音声認識精度 | 有料とほぼ同等 | 同等(差は小さい) |
| 要約・AI議事録 | 回数制限あり | 制限緩和・高度化 |
| 話者分離 | 一部のみ | 標準搭載 |
| チーム共有 | 不可が多い | 可 |
精度を理由に有料へ急ぐ必要はない。上限と運用機能で判断するのが賢い。
Notta — 無料枠つきで日本語議事録の本命
Nottaは日本語の会議文字起こしで最も指名買いされるツールの一本。フリープランが0円で用意され、有料はプレミアム1,185円/月、ビジネス2,508円/月、エンタープライズは要問い合わせという段階構成だ(出典: LISKUL 2026年版比較表)。
対応ファイル形式はwav・mp3・m4a・mp4などで、1ファイルあたり5時間/1GBまで扱える(出典: LISKUL)。録音・インポート・Web会議連携を1つでこなすので、議事録づくりの起点として座りがいい。
無料枠の時間制限がボトルネックになりやすいので、商談を毎日回す営業チームなら最初からビジネスプランを見込むのが現実的。逆に週1〜2回の社内会議なら、フリーで様子を見て足りなくなったら課金、で十分回る。
OpenAI Whisper — 完全無料・オフラインの最強コスパ
お金を一切かけたくないならOpenAI Whisperが一択に近い。OpenAIが公開したオープンソースの音声認識モデルで、ローカル環境で動かせば利用料は完全に0円、時間制限もない。
最大の強みはオフライン完結。音声をクラウドに送らず手元のPCで処理できるため、機密性の高い社内会議や、外部送信を避けたい取材音源に向く。多言語対応で日本語精度も高い。
弱点は手間だ。コマンドライン操作やPython環境のセットアップが要る。GPUがないPCだと長尺の処理に実時間以上かかることもある。手軽さではクラウド型に負けるが、コストとプライバシーでは敵なし。クラウド経由の従量課金APIも別途あるので、開発に組み込むならWhisper関連の比較も見ておくといい。
文字起こしさん — 100言語対応で字幕作成に強い
『文字起こしさん』は無料から使えるWebアプリで、最新AIで音声を簡単・高速にテキスト化する(出典: 文字起こしさん公式)。英語をはじめ100言語に対応した外国語文字起こしや、動画のSRT字幕作成機能を備える。
YouTube動画の字幕づくりや、外国語インタビューの書き起こしのような「テキスト化の先に編集がある」用途で重宝する。ブラウザだけで完結するので、インストール不要なのも地味に効く。
無料枠で試して、量が増えたら有料へ——という王道の使い方ができる。字幕特化のニーズなら候補から外せない。
tl;dv — Web会議に自動参加して録画・文字起こし
tl;dvはZoom・Microsoft Teams・Google Meetといった主要Web会議ツールと連携し、会議に自動で参加して録画と文字起こしを行う(出典: SHIFT AI TIMES無料AI議事録10選)。無料プランが用意されている。
強みは「録音ボタンを押し忘れる」事故が起きないこと。カレンダー連携で会議が始まると自動で記録を開始するため、後から「録ってなかった」が消える。話者識別と要約も備える。
リモート会議が多いチームなら、これを入れておくだけで議事録の取りこぼしが激減する。対面より画面越しの打ち合わせが主戦場の人向けだ。
Rimo Voice — 日本語インタビューに強い国産ツール
Rimo Voiceは日本語の会議・インタビューに最適化された国産の文字起こしサービス。日本語の言い回しやフィラー(「えーと」「あの」)の処理に強く、ライターや編集者の取材書き起こしで評価が高い。無料トライアルから試せる。
国産ゆえにサポートやUIが日本語前提で作られているのが安心材料。海外ツールの自動翻訳UIに疲れた人には、この素直さが効く。
長尺インタビューを記事化するワークフローなら、Whisperの完全無料とRimoの使い勝手を天秤にかける構図になる。手間を金で買うか、コストを優先するかの選択だ。
PLAUD NOTE — 対面の録音に強いAIボイスレコーダー
PLAUD NOTEは高度なAI連携を備えたボイスレコーダー型のデバイス(出典: ABKSS)。スマホに貼り付けて使う物理デバイスで録音し、専用アプリで文字起こしと要約を行う。
Web会議ではなく対面の打ち合わせ・営業訪問・現場ヒアリングに強いのが差別点。スマホアプリだけだと録音品質が不安な場面で、専用ハードの集音力が活きる。
デバイス購入が前提なので「完全無料」ではないが、AI処理の無料枠が付く。対面録音が多い職種なら検討価値がある。
無料の文字起こしAIはどう選べばいい?
選び方は3つの軸でほぼ決まる。精度・料金・機能性。具体的には「日本語の認識精度が業務に耐えるか」「無料枠の時間で足りるか」「話者分離・タイムスタンプ・専門用語対応があるか」を順に潰す(出典: 吉和の森選び方解説)。
最初に決めるべきは音源のタイプだ。Web会議か、対面か、既存の録音ファイルか。Web会議なら自動参加型のtl;dv、対面ならPLAUD、ファイル投入ならNottaやWhisperと、入口で候補が絞れる。
次に量。週数回ならどの無料枠でも足りる。毎日数時間なら、無料枠ありきではなく有料前提か、時間無制限のWhisperローカルかの二択になる。
最後に機密性。外に出せない音声を扱うなら、クラウド送信が前提のサービスは外し、オフライン実行できるWhisperを軸にする。ここは妥協しないほうがいい。
| 選定軸 | チェックポイント | 推し |
|---|---|---|
| 音源タイプ | Web会議/対面/ファイル | tl;dv/PLAUD/Notta |
| 利用量 | 月の合計時間 | 多いならWhisper or有料 |
| 機密性 | 外部送信の可否 | オフラインのWhisper |
| 日本語精度 | フィラー・固有名詞 | Notta/Rimo |
| 出力形式 | 字幕SRT・議事録 | 文字起こしさん/Notta |
迷ったら音源タイプから入るのが事故が少ない。
話者分離は無料でもできる?
できる。ただし無料枠だと制限つき、というのが正直な現状だ。NottaやRimo Voice、tl;dvは話者分離(誰が話したかの区別)に対応するが、無料プランでは時間や回数に上限がかかることが多い。
複数人の会議で「Aさん」「Bさん」と発言者を自動で振り分けてくれると、議事録の読みやすさが段違いになる。逆に1対1のインタビューや一人語りの音声なら、話者分離は不要なので無料枠で十分。
Whisper単体は標準では話者分離を持たないが、別ツール(pyannoteなど)と組み合わせれば実現できる。手間はかかるが完全無料で話者分離まで到達できるのは魅力だ。
無料の文字起こしAIに弱点はある?
ある。誇張せず弱点を3つ挙げておく。1つ目は時間上限。無料枠は月数十分〜数時間で頭打ちになり、長尺をタダで回し続けるのは難しい。
2つ目は専門用語の取りこぼし。医療・法律・社内固有名詞のような単語は、無料枠だと誤変換が増える。有料の専門用語辞書機能がないと、結局あとで手直しが要る。
3つ目はセキュリティの線引き。無料サービスはデータの取り扱いがプランによって変わる。機密音声を無料枠に流すのはリスクなので、ここは法人向けの認証取得ツールか、オフラインのWhisperを選ぶべきだ。
弱点を理解した上で「自分の用途では問題にならない」と確認できれば、無料で十分戦える。
商用利用や記事化に使っていい?
基本的に可だ。議事録・字幕・取材の記事化といった商用利用は、主要ツールで認められている。ただし各サービスの利用規約は必ず確認してほしい。生成物の権利やデータ利用ポリシーはツールごとに微妙に違う。
取材音源を記事にするライティング業務では、文字起こしAIで一次テキストを作り、人が編集して仕上げる流れが定番。AIの出力をそのまま公開するのではなく、必ず人の目を通すのが品質の生命線だ。
AIを使った制作フロー全体を整えたいなら、画像や動画の生成も含めて考えるといい。動画生成はSora完全ガイド、画像系のワークフローはComfyUIとStable Diffusionの比較が参考になる。
業種別だとどれを選ぶ?
業種で最適解は変わる。営業・商談中心なら、Web会議録画のtl;dvか議事録特化のNotta。録り逃しを防ぐ自動参加が効く。
メディア・ライター業なら、日本語インタビューに強いRimo Voiceか、長尺を無料で回せるWhisper。記事化の前工程として精度とコストの両取りを狙う。
医療・士業のような機密性の高い現場は、オフライン実行のWhisperか、認証を取得した法人向けツール一択。クラウド無料枠に機密音声を流すのは避ける。専門特化のAI活用イメージは歯科クリニックのAI活用事例も具体的でわかりやすい。
実際に使っている企業・チーム
文字起こしAIは個人だけでなく、企業の議事録・マニュアル・研修資料づくりで広く使われている(出典: ABKSS)。実在ツールの活用シナリオを挙げる。
- LINE WORKS AiNote(旧CLOVA Noteの法人版) — LINE WORKSを導入する企業で、社内会議の議事録自動化に使われる。Web会議の録音から文字起こしまでを1台の端末で完結させる運用が紹介されている(出典: SHIFT AI TIMES)。
- PLAUD NOTE導入チーム — 営業や現場ヒアリングが多い組織で、対面の打ち合わせをデバイス録音し、AIで要約まで落とす使い方(出典: ABKSS)。
- tl;dv利用チーム — Zoom・Teams・Google Meetを日常的に使うリモート組織が、会議への自動参加で議事録の取りこぼしをなくす運用(出典: SHIFT AI TIMES)。
いずれも「記録の自動化で人手を別業務に回す」という同じ動機で導入されている。
料金まとめ — 無料から有料への現実的な分岐点
無料で始めて、どこで課金を検討すべきか。判断材料として、公開されている料金を整理しておく。Nottaはフリー0円・プレミアム1,185円/月・ビジネス2,508円/月(出典: LISKUL)。Texterは無料0円・Premium M 1,500円/月・Premium Y 7,400円/年(出典: LISKUL)。
無料から有料へ移る分岐点は、ほぼ「月の処理時間が無料枠を超えるかどうか」で決まる。週1〜2回なら無料で粘れる。毎日複数の会議が走るなら、最初から月1,000〜2,500円程度の有料を見込むほうが結局トクだ。
完全無料を貫くなら、時間無制限のWhisperローカル一択。手間と引き換えにコストを完全に0にできる。ここはトレードオフをどう取るかの問題。
AI PICKS編集部の判定
無料の文字起こしAIは「完全無料のWhisper」と「無料枠つきのNotta系」を両極に置いて考えると、選択がぶれない。日本語の会議議事録を手軽に回したい大多数のユーザーにとって、Nottaのフリープランは破格の出発点だ。0円で話者分離も要約も触れるので、まずここで自分の用途に足りるか試すのが正解の入口になる。
一方で、機密音声を扱う・長尺を毎日回す・1円も払いたくない、のいずれかに当てはまるなら、Whisperのローカル実行が圧倒的に強い。セットアップの手間さえ越えれば、時間無制限・完全オフライン・認識精度も有料同等という条件は、クラウド型がどう逆立ちしても出せない。手間を金で買うか、コストを取って手を動かすか——この一点で陣営が分かれる。
リモート中心ならtl;dv、対面が多いならPLAUD、日本語インタビューならRimoと、音源タイプで指名すれば失敗しない。「とりあえず1本」ならNotta、「コスト最優先」ならWhisper、が編集部の結論だ。
編集部の率直な評価
正直に言えば、無料枠つきツールの「無料」は体験版に近いものも多く、本気で使うと早晩課金の壁に当たる。そこを承知で入れば、Nottaのバランスは重宝する。日本語議事録の完成度は一級だ。
Whisperは玄人向けだが、ハマる人には手放せない存在になる。コストゼロ・オフライン・無制限の三拍子は他にない。ただし非エンジニアには導入のハードルが高く、そこは正直イマイチな部分。万人向けではない。
文字起こしさんの字幕特化、tl;dvの自動参加は、用途が刺されば一択級に効く。逆に汎用で全部こなそうとすると器用貧乏になりやすい。用途を絞って選ぶほど満足度が上がる、というのがこのカテゴリの鉄則だ。
よくある質問(FAQ)
Q. 完全無料で時間制限なしの文字起こしAIはある?
OpenAI Whisperのローカル実行が該当する。OSSなので利用料は0円、ローカルで動かせば時間制限もない。ただしセットアップにPython環境などの準備が必要で、手軽さはクラウド型に劣る。
Q. 日本語の精度が一番高い無料ツールは?
会議議事録ならNotta、長尺やフィラーの多いインタビューならWhisperやRimo Voiceが上位。無料枠でも音声認識エンジンは有料と共通のことが多く、精度差より時間上限の差のほうが大きい。
Q. 無料でも話者分離(誰が話したか)はできる?
できる。Notta・Rimo Voice・tl;dvが話者分離に対応する。ただし無料プランは時間や回数に上限がかかる場合がある。Whisper単体は標準非対応だが、別ツールと組み合わせれば無料で実現可能。
Q. 機密性の高い会議を文字起こししても安全?
クラウド型は音声を外部送信するため、機密音声には慎重な判断が要る。外に出せないなら、オフライン完結のWhisperか、ISO27001などの認証を取得した法人向けツールを選ぶのが安全。
Q. YouTube動画の字幕を無料で作れる?
作れる。文字起こしさんはSRT字幕作成機能を備え、100言語に対応する(出典: 文字起こしさん公式)。動画字幕に特化したい場合の有力候補。
Q. Web会議の議事録を自動で取りたい場合は?
tl;dvが向く。Zoom・Teams・Google Meetと連携し、会議に自動参加して録画・文字起こしする。録音忘れの事故がなくなるのが最大の利点。
Q. 無料から有料に切り替える目安は?
月の処理時間が無料枠を超え始めたタイミング。週1〜2回の会議なら無料で十分、毎日複数の会議が走るなら月1,000〜2,500円程度の有料が結局トクになる。
関連する比較・代替を見る
- Notta vs PLAUD NOTE — クラウド議事録とデバイス録音の比較
- Notta vs Rimo Voice — 日本語議事録ツール同士の直接対決
- Notta vs Whisper — 無料枠つきと完全無料の二択
- Rimo Voice vs Whisper — 国産の使い勝手vsコストゼロ
- Plaud Note vs Whisper — 対面録音デバイスとOSSの比較
- Nottaの代替ツールを見る — 議事録ツールの乗り換え候補
各ツールの公式サイト(一次情報)
料金・機能・対応範囲は各社公式が一次情報です。本記事は公開時点の検証に基づきますが、最新かつ正確な条件は必ず各公式ページで確認してください。
- Notta — 公式サイト(AI PICKSの詳細)
- Whisper — 公式サイト(AI PICKSの詳細)
- Rimo Voice — 公式サイト(AI PICKSの詳細)
- PLAUD NOTE — 公式サイト(AI PICKSの詳細)
- tl;dv — 公式サイト(AI PICKSの詳細)
参考にした一次情報
- LISKUL「【2026年版/比較表つき】AI文字起こしツールおすすめ17選を比較」 — Notta・Texterの料金と対応形式
- 文字起こしさん「【2026年版】格安文字起こしサービス9選」 — 無料枠・100言語・SRT字幕
- 吉和の森「【2026年版】AI文字起こしツールおすすめ15選」 — 選び方の3軸とAI議事録の定義
- SHIFT AI TIMES「【2026年最新】無料のおすすめAI議事録作成ツール10選」 — tl;dv・LINE WORKS AiNoteのWeb会議連携
- ABKSS「AI文字起こしツールおすすめ10選」 — PLAUD NOTE・LINE WORKS AiNoteの活用例と音声認識の仕組み
文字起こしの先にあるAI活用を広げたい人は、Meta AIの使い方ガイドやAI文字起こし・音声カテゴリもあわせてどうぞ。
