谷歌强调,Gemini Live许可用户在对话中随时打断AI,提出自己的问题,AI会实时调度以适应用户的说话办法,用户可通过Gemini运用程序与AI对话时,从10种不同的自然声音中选择他们喜好的回应声音。
在发布会上,谷歌展示了Gemini Live如何仿照口试场景,为用户供应演讲技巧的建议,并根据用户的表现提出优化见地。
Gemini Live是基于Gemini Advanced模型构建的,该模型经由优化,更适宜永劫光的对话,并能够处理大量的高下文信息。
只管谷歌曾在I/O大会上展示过Gemini Live的多模态输入功能,但目前该做事尚未支持这一特性,无法通过手机摄像头捕捉环境信息进行交互。