作者 | 喷鼻香草
编辑 | 李水青
智东西5月11日,本日凌晨,OpenAI宣告将于美国韶光13日上午10点(北京韶光14日凌晨1点)在官网直播,演示ChatGPT、GPT-4的更新内容。
据外媒The Information今日宣布,OpenAI正在构建具备音频和视觉理解能力的AI语音助手,个中一些功能已经开始向客户展示,可能不才周的发布活动中预览。
知情人士透露,OpenAI可能会在今年内完成GPT-5的开拓并公开拓布。此外,OpenAI还操持推出一种新的定价模式,客户通过预支费预定Token,最高可以享受50%的折扣。
此前有多家外媒和博主曝料,称OpenAI将在近日发布AI搜索引擎。其CEO阿尔特曼对此回应道:“不是GPT-5,也不是搜索引擎,但我们一贯在努力开拓一些我们认为会得到喜好的新东西。”
▲阿尔特曼回应新品演示(图源:X)
值得把稳的是,其竞争对手谷歌的I/O开拓者大会韶光定在美国韶光14日上午10点(北京韶光15日凌晨1点),估量可能发布Gemini大模型的主要更新。OpenAI这次发布韶光没有定在之前外媒曝料的5月9日,而是“恰好”卡在I/O大会的前一天,炸药味可谓浓厚。
要知道,这已经不是OpenAI第一次“卡点”偷袭谷歌新品。今年2月,谷歌放出Gemini 1.5 Pro大招,结果没过几个小时,OpenAI就取出文生视频“王炸”模型Sora,狠狠抢了Gemini 1.5 Pro的风头。
直播发布地址:http://openai.com
一、AI语音助手仍存在“幻觉”问题,或将集成至ChatGPT免费版据The Information宣布,阿尔特曼的终极目标是开拓出类似电影《她》(Her)中,可高度相应的虚拟助手,提升苹果Siri等现有语音助手的可用程度。
▲电影《她》剧照
OpenAI认为,具有视觉和音频功能的AI语音助手具有像智好手机一样的变革性潜力,理论上其可以做到一系列现在的AI助手无法做到的事,例如充当论文、数学问题辅导老师,或是翻译交通标识、帮助办理汽车故障等。
但类似的技能目前所需硬件门槛太高,无法在个人设备上运行,用户可以在短期内利用基于云的版本来获取这些功能,例如自动化客户做事Agent。
OpenAI目前已经推出具备音频转录、文本转语音等功能的软件,不过这些功能是基于独立的对话AI模型实现,而新的语音助手则将这些功能整合在一起。据知情人士透露,该AI语音助手的音频功能能够帮助客服职员更好地理解对方的语气。
目前尚不清楚OpenAI何时向付费客户供应这些新功能,但据试用过该语音助手的人士透露,OpenAI终极的操持是将这些功能都纳入ChatGPT免费版本,目标是比目前其最前辈模型GPT-4 Turbo的运行本钱更低。该人士还谈道,AI语音助手在有些类型的问题上回答优于GPT-4 Turbo,但仍旧存在幻觉问题。
对此,OpenAI发言人没有回应置评要求。
二、与谷歌竞争iPhone互助位,GPT-5或于年底前发布OpenAI推出AI语音助手紧张目标是与谷歌竞争。
谷歌的AI模型Gemini能实时相应语音命令,并识别图像、视频等。不过这些功能目前仍须要研究职员附以图像和笔墨解释,且并不能理解许多传统的语音指令,也不能像Siri和谷歌助手等传统语音助手那样与用户对话。
▲谷歌展示Gemini多模态功能(图源:谷歌)
另一方面,提高模型的视觉、音频能力也有助于OpenAI与苹果达成互助。
最近几个月,苹果与OpenAI就下一代iPhone操作系统如何整合OpenAI的模型进行了谈论。然而,与此同时,苹果也与谷歌进行着类似的会谈。
这场竞争的最新是,据彭博社今早宣布,苹果已靠近与OpenAI达成协议,将不才一代iPhone操作系统iOS 18中利用ChatGPT;与谷歌尚未达成协议,但会谈仍在进行中。
除了可能不才周推出的AI语音助手外,OpenAI还一贯致力于构建一款AI搜索引擎,旨在与谷歌竞争。此外,其也在开拓一种被称作“打算机利用Agent”的自动化软件,用来赞助软件开拓和其他打算机任务。
阿尔特曼还在与iPhone开拓者乔尼·艾维(Jony Ive)互助开拓一款独立的AI硬件。然而,最前辈的AI模型体积弘大,须要在云端运行,并须要互联网连接才能事情。要使具有视觉和听觉功能的繁芜AI模型变得足够小巧,以便在设备上运行,可能须要几个月乃至几年的韶光。
不过,大家最关心的可能还是GPT-5。据The Information宣布,一位靠近OpenAI领导人的人士称,其可能在今年年底完成GPT-5并公开拓布。
OpenAI的新产品和AI模型开拓事情进展得风起云涌,与此同时,其此前宣告的一些项目却变得不再那么受关注。只管OpenAI曾向开拓者承诺,会在今年第一季度推出GPT Store开拓者勉励操持,但目前仍没有实现。
三、操持推出预支费定价模式,最高供应50%折扣在定价方面,据知情人士透露,OpenAI操持推出一种新的定价模式,如果客户通过预支费预定Token,最高可以享受50%的折扣。
这样的优惠形式在云打算领域比较常见,微软Azure、谷歌云、亚马逊云做事(AWS)等都供应提前预定做事器容量折扣的办法来降落本钱。
目前,按需定价供应API(运用程序接口)是OpenAI大模型的紧张付费形式,通过每天生100万Tokens,向开拓者收取几美分至一百多美分不等的用度,个中大客户可以享受批量折扣。
此前OpenAI已经供应了一种降落开拓者本钱的办法,其在4月推出Batch API,如果开拓者批量上传模型查询,并接管等待最长24小时的韶光,就可以获取更低的价格。
Together AI和Anyscale等AI做事器经销商曾表示,在他们的软件上运行开源模型要比利用OpenAI的模型便宜6倍。通过更灵巧的定价,OpenAI与其他模型开拓商的竞争将更具上风。据透露,其今年的营收可能达到数十亿美元。
结语:OpenAI谷歌相争,苹果微软得利?OpenAI与谷歌之间的竞争愈发激烈,二者之间的“商战”炸药味也愈发浓厚。OpenAI又一次将新品发布韶光定在了谷歌重大发布韶光附近,彷佛执着于打劫谷歌风头这件事。
这一边,苹果同时与OpenAI、谷歌商谈模型集成至iPhone事宜,再次加剧了两家公司之间的竞争。虽然OpenAI被曝已与苹果达成互助,但谷歌那边的会谈也仍在连续。
而另一边,微软作为OpenAI最大的财务支持者,可以优先利用其前辈技能来改进自己的语音助手。而微软也并非“决一死战”,除了积极自研模型外,还投资了OpenAI有力竞对Mistral AI,后者成为第二家在微软Azure云平台上供应商业AI模型的公司。
下周的OpenAI新品发布和谷歌I/O大会,或许会将这场“商战”推向新高度。究竟谁的“大招”会更厉害,我们拭目以待。