谷歌强调,Gemini Live许可用户在对话中随时打断AI,提出自己的问题,AI会实时调度以适应用户的说话办法,用户可通过Gemini运用程序与AI对话时,从10种不同的自然声音中选择他们喜好的回应声音。

在发布会上,谷歌展示了Gemini Live如何仿照口试场景,为用户供应演讲技巧的建议,并根据用户的表现提出优化见地。

Gemini Live是基于Gemini Advanced模型构建的,该模型经由优化,更适宜永劫光的对话,并能够处理大量的高下文信息。

只管谷歌曾在I/O大会上展示过Gemini Live的多模态输入功能,但目前该做事尚未支持这一特性,无法通过手机摄像头捕捉环境信息进行交互。

谷歌推出AI语音聊天做事 用户可随时打断并将即时适配对话内容