Investing.com - 谷歌周四宣布推出Gemini 3.1 Flash Live,这是一款新的音频和语音模型,旨在实现更高精度和更低延迟的实时对话。该模型目前通过Google AI Studio中的Gemini Live ...
在生成式AI竞争加速向“实时交互”演进之际,谷歌正式推出Gemini 3.1 Flash ...
今天,我们通过 Gemini 3.1 Flash Live 推进了 Gemini 的实时对话能力,这是我们迄今为止质量最高的音频和语音模型。它为新一代语音优先AI提供了所需的速度和自然节奏,为开发者、企业和日常用户提供更直观的体验。 3.1 ...
人工智能生成的文本通常具有某种特定的风格,容易被识别为机器生成的内容,但随着技术的进步,识别这些特征变得越来越困难。我们可能正在看到生成式人工智能音频的类似演变。谷歌已经发布了一种名为Gemini 3.1 Flash Live的新型AI音频模型——顾名思义,它专为实时对话而设计。该模型已于今日开始在某些谷歌产品中推出,开发者也将能够使用该模型构建自己的聊天机器人。
语音AI最烦人的一句话,可能终于要被谷歌干掉了。Gemini 3.1 Flash Live 正在逼近「像人与人说话那样响应」的体验:不仅更快、更自然,连在交通声、电视声这样的真实噪音里,也更能听清你在说什么。
谷歌近日推出全新实时语音模型Gemini 3.1 Flash Live,标志着语音交互技术进入新阶段。该模型在Gemini应用、Search Live及Google AI Studio同步上线,开发者可通过预览版率先体验语音驱动应用开发等创新功能。据多项评测显示,其性能已超越GPT-Realtime-1.5、Qwen3 Omni ...