100以上の言語に対応し、感情や話速を制御できるリアルタイム音声合成モデルとして、会話AIやコンテンツ音声を自然に生成できます。