AI PICKS
AI用語辞典音声・音楽

全二重音声対話 (Full-duplex Voice)

読み: ぜんにじゅうおんせいたいわ

最終更新: 2026-06-28・AI PICKS編集部

定義

全二重音声対話とは、送話と受話を同時並行で処理し、会話の割り込みや相槌をリアルタイムで扱えるAI音声インタフェースのこと。

全二重音声対話 (Full-duplex Voice)とは — 詳しく解説

全二重音声対話(Full-duplex Voice)とは、マイクとスピーカーが同時に動作し、送話と受話を並行処理する通信方式をAIに応用した技術。従来の半二重方式(ウォーキートーキー型)では一方が話し終えてから応答するが、全二重では話しながら相手の発話を拾い、割り込みや相槌をリアルタイムで処理できる。2024年のGPT-4o Real-time API発表が契機となり、2026年現在は音声AIエージェントの標準インタフェースとして普及しつつある。 実運用での最大の課題はエコーキャンセルとレイテンシ。クラウド経由では往復遅延が100〜300msに達し、自然な対話感が損なわれるケースが多い。現場ではWebRTCとサーバーサイド処理のバランス設計が不可欠で、エンドツーエンド遅延を150ms以下に抑えることが実用ラインの相場感とされる。 コスト面ではReal-time API系が1分あたり$0.06〜$0.24程度と通常テキストAPIの10〜30倍。AI PICKSが調査した事例では通話時間の短縮(平均3分以内)とキャッシュ設計がROIの鍵。選び方は「割り込み対応精度」「エコーキャンセル品質」「多言語対応」の3軸で比較するのが2026年の現場基準だ。

全二重音声対話 (Full-duplex Voice)の使用例

  • コールセンター向け全二重音声AIで割り込み検知を実装し、顧客発話中にも適切な相槌を挟むことで応対満足度を向上させた事例。
  • GPT-4o Real-time APIを採用した英会話学習アプリで、ネイティブ並みの自然な対話感を実現し離脱率を30%改善した実例。

全二重音声対話 (Full-duplex Voice)に関連するAIツール

関連用語

音声・音楽」の他の用語

AI用語辞典をすべて見てみませんか

12カテゴリ・252語以上を体系的に整理しています

辞典トップへ