量子位 | "大众年夜众号 QbitAI
附近年底,谷歌终于放大招了!
刚刚结束的AI@年度活动上,谷歌一口气发布了四项最新的AIGC技能成果。
个中最引人把稳的要数文本图像模型Imagen首次开放测试,敲黑板,这次安卓、苹果都能玩。
其他有趣的产品,还有AI写作帮忙工具LaMDA Wordcraft、结合Imagen Video和Phenaki上风的超长连贯性视频天生模型等等。
而且,除了官方的总结,几位来自谷歌的科学家也在推特分享了自己心中谷歌AI研究的新进展。
详细有哪些?一起往下看。
Imagen首次开放测试自推出以来,Imagen一贯被与OpenAI的DALL-E 2、Stability AI的Stable Diffusion比较较,但不同的是,谷歌一贯没有将该系统向公众年夜众开放。
现在,谷歌终于松口,宣告将把Imagen添加到其AI Test Kitchen运用中。
AI Test Kitchen,是今年I/O大会上,谷歌推出的一款用于对各种AI系统进行测试的运用程序,目前苹果、安卓用户都能下载。
最初的时候,用户仅可以在上面与AI谈天机器人LaMDA 2进行互换,这次更新将添加两种与Imagen互动的新办法:城市梦想家和Wobble。
在“城市梦想家”中,你可以用笔墨命令建造不同主题的城市,个中,Imagen模型承担了创建样本建筑和地块(城市广场、公寓楼、机场等)的浸染。
在Wobble中,你可以创造一个小怪物,DIY它的材质(粘土、毛毡、橡胶等),然后给它穿上你选择的衣服,还可以戳戳它,让它“舞蹈”。
只管与其他文本到图像的模式比较,这些互动办法看上去还比较受限定,但谷歌产品管理高等总监乔希·伍德沃德(Josh Woodward)阐明称,这一步的意义在于得到"大众对这些AI系统的反馈,以及测试哪些行为会使得系统崩溃。
其他AIGC产品除了最受关注的Imagen模型,谷歌还宣告了在其他内容格式上的AI内容天生技能。
比如LaMDA Wordcraft,一个在大措辞模型LaMDA根本上开拓的、能赞助专业作家写作的AI写文工具。
它的浸染,是在创作者写作的过程当中,根据现有的文本产生新的想法,或者帮助重写已有文句,从而帮助创作者打破“创作瓶颈”。
值得一提的是,下图中的“Evaluative Soliloquies”便是作家刘宇昆(《三体》英文版译者)在Wordcraft帮助下撰写的短篇小说。
除此之外,谷歌还结合了Imagen Video和Phenaki两大模型的上风,推出了一个能天生超长连贯性视频的新模型。
还有AudioLM,一个无需笔墨和音乐符号演习,仅通过聆听音频样本,就可以连续天生补充乐曲的音频模型。
说完这些谷歌官方公布的新技能,让我们再来看看谷歌的科学家们自己是怎么说的。
谷歌科学家眼里的新进展除了产品层面,今年谷歌AI研究的新进展还有哪些?
谷歌大脑的工程师周登勇在推特上分享了自己的意见:大模型学会了如何阐明答案,检讨答案,并将繁芜问题分解成子问题办理。
而这统统还要从谷歌今年1月发布的一篇论文“Chain of Thought Prompting Elicits Reasoning in Large Language Models”开始提及。
便是在这篇论文中,谷歌首次提出了思维链提示(chain of thought prompting)的观点。
大略来说,思维链提示便是一种分外的高下文学习,不同于标准提示只是给出输入-输出对的示例(如下图左),思维链提示还会额外增加一段推理的过程(如下图右)。
这一步的目的是让模型模拟并为当前问题天生自己的思维过程,终极提高天生结果的准确性。
该方法在LaMDA-137B、GPT-3 175B、PaLM-540B三个大型措辞模型上都得到了验证:比拟标准提示,新方法在算术、知识和符号推理任务的准确率上都有了明显的提高。
并且,随着模型参数量级的提升,思维链提示的效果也呈指数级上升。
尤其是合营上谷歌的超级措辞模型PaLM-540B,在包括数学问题在内的多个推理基准测试中达到了SOTA水平,乃至超过了利用验证器进行微调的GPT-3。
很快,两个月后该团队又对该研究进行了跟进。
这篇文章险些利用了和初代文章完备一样的数据集和设置,紧张改进是提出了一种称为自洽性(self-consistency)的大略策略。
大略来说,就像人在思考时会想出几种不同的办理方案再作出判断一样,自洽方法会通过思维提示链从措辞模型中采样一组不同的推理路径,再对答案进行多数投票(majority vote),末了返回个中最自洽的答案。
这一步优化不仅意味着离模拟人类思维模式更近一步,还做到了显著地提高思维链方法的性能。
最新的进展是,为理解决从易到难的泛化问题,该团队又提出了一种新颖的提示策略。
它将繁芜问题简化为一系列子问题,然后依次办理这些子问题,从而通过对先前办理的子问题的答案来促进办理给定的子问题。
就这样,谷歌正在演习AI一步步朝着人类的思维模式靠近。
末了,说了这么多,这一年,你印象最深的谷歌AI研究是什么?
参考链接:[1]https://twitter.com/dmvaldman/status/1587525225209425921[2]https://arxiv.org/abs/2201.11903[3]https://arxiv.org/abs/2203.11171[4]https://arxiv.org/abs/2205.10625
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一韶光获知前沿科技动态