【新智元导读】最近,来自NUS、斯坦福、谷歌DeepMind等机构的研究职员,考试测验开拓了一个评估人类和AI的创造力的框架。
而当人类用尽所有手段来逼迫AI把创造力发挥到极限,创造GPT-4险些对付所有事物认知的极限都是无尽的宇宙空间。

AI的创造力到底极限在哪里?

最近网友创造,只要应时地给GPT-4来点PUA,就能让它将自己想象力和创造力的极限给引发出来。

前段韶光,「AI冷课长」用AI画的不同退休金的中国老太太,一度登上微博热搜。

AI画中国退休老太太微博大年夜火快乐小狗寻衅GPT4想象力极限

给出的指令从「画一个没有退休金的中国老太太」、到「每个月有1000块退休金的老太太」,再到「每个月10万退休金的老太太」等等……

网友纷纭表示,AI是懂养老的!

当然,最得民气的还得是末了一幅!

PUA GPT-4画出「傻鹅之王」,宇宙和韶光旅行是终点

不足为奇,Pipedream Labs的CEO Garrett Scott McCurrach也整了一个寻衅GPT-4极限的活儿。

他在社交媒体上发布了一张鹅的图像,和网友说,每有10个人点赞,我就让这只鹅变得更傻一点。

于是网友轻微一发力,这张照片就被点赞了好几万次。

而McCurrach本人,也开始了自己对GPT-4的PUA。

GPT-4让鹅进一步变傻,眼睛一只大一只小,戴个傻乎乎的蝴蝶结,有那味了。

看来在GPT-4眼里,五彩斑斓的颜色彷佛和傻的关联度很高。

还有便是,多数由于吃了太多「蘑菇」而导致的眼球充血。

看得出来,这几只傻鹅确实是智商不太高的样子。

总的来说,张着嘴,伸着舌头,变大的眼睛,都是越来越傻的标志。

终极GPT-4将傻的定义勾留在了「口吐异物」这个点上。

到这里,彷佛GPT-4的想象力到达了极限。

如果还须要对「傻」这个词进行进一步的演绎,GPT-4已经做不到了,须要人类给与更加明确的提示。

作者接着PUA GPT-4,给了它关键词「傻鹅之王」之后,GPT-4终极给出了它眼里的有着「帝王之气」的傻鹅。

同样的思路,网友又对狗子下手了,让GPT-4创造一张高兴的狗狗照片。

这次是让狗狗变高兴,看着效果还不错。

狗狗拿上了自己喜好的球和飞盘,看来GPT-4是懂狗子的。

而更高兴的狗狗眼里,天下都变小了,自己在不断变大,身体也腾空了起来。

此时,五彩的背景,微微伸开的小嘴又是高兴的象征。

迷幻的颜色,不断变大的身躯成为了GPT-4想象之中越来越高兴的意象。

末了,大到了太空之中,成为了和星系比较肩的狗狗。

不断被人类PUA的GPT-4终于让「狗狗快乐似神仙」。

进入宇宙的狗狗,终于融入了平行天下,成为了一只看不见摸不着的「快乐之狗」。

也让我们对GPT-4的创造力和对快乐的理解肃然起敬。

在见识到了GPT-4对付「傻」和「快乐」理解的极限之后,网友换了个口味,想看看GPT-4的想象力之中,「平平无奇」有没有极限。

网友让GPT-4天生了一张普通的街道照片。

然后是一张普通的客厅照片,统统都是最普通的设计。

普通的书桌,除了有两个日历稍显特殊之外,确实非常普通,连显示器看上去都是多年前的老款,不能再普通了。

城市最普通的街角,看路牌彷佛是纽约一个普通的十字路口。

一杯非常普通的咖啡,微微冒着一点热气,连温度都是如此的克制。

一个普通的开关,背景是白色的墙面,唯一的分外之处是和两个螺丝的组合,看上去有点像一个人脸。

当作者哀求GPT-4画一个极致普通的物品时,GPT-4给出的答案是一个放在桌子上的条记本。

没有任何的特色,极致的简约和普通不过如此。

当作者认为还能更普通时,GPT-4有点受不明晰,给出了一个白色房间中的一堵白墙,看来白色在AI眼里便是最为普通的颜色,方形便是最为普通的形状。

当作者哀求再普通一些,GPT-4给出了一张白色的画布。

这可能是一个作图AI眼中最为普通的物品,毕竟它是创作统统内容的根本。

当作者哀求更进一步的普通时,GPT-4给出了自己分外的回答:

「这是一个普通程度最高的形象——一个毫无特色的虚空,充斥着虚无感」。

还不足!
一定还能更普通!

于是,GPT-4画出了一个比「虚空」更加普通的物体,一个白色空间中的一个白色小点。

又小又白看来便是最为普通的物体。

作者依然不相信,质问GPT-4还有没有更加普通的东西。
GPT-4拿出了自己压箱底的「普通之物」:

一个巨大的空旷的空间,彷佛还能无限延伸。

终极,在人类无法想象的空间中,这是最无聊最普通的一个形象。

它普通到已经无法存在了。
确实,看上去就像一个普通的「黑洞」,没有任何「特点」能够逃逸出来。

但实在,如果要一贯追问,GPT-4彷佛永久不会停下来,会一直的输出它认为更加「普通」的图像。

一贯到所有问题的闭幕:GPT-4额度用完。

AI的极限是太空?实在人类也是

这是互联网哲学家、人工智能研究员Eliezer Yudkowsky对AI进行的「普通测试」,在不断地逼迫下,AI每每都会把最极度的输出归结到太空或者是韶光旅行上。

大概率是由于和人类理解的极限一样,太空也是AI所知道的这个天下的极限所在,以是终极对付AI想象力的PUA,AI都会以输出太空中的内容作为终极的结果。

而在追求极限的过程中,GPT-4每每会向人类埋怨,说自己已经到达极限了。

但是如果人类以更加严厉的口吻进一步敦促AI更进一步时,乃至和AI争吵时,AI每每还能再挖掘一些自己的潜力。

这个过程乃至让不少网友看了后以为人类是不是太过残酷了。

但是OpenAI的系统提示会回答,「感情和痛楚不是编程的一部分」在逼迫AI的过程中,彷佛不须要考虑太多。

但是Yudkowsky也感叹到,「对付人类来说,彷佛这不是一个好兆头,人类似乎没有任何办法确定(AI系统能否感到痛楚)。

AI能像人类一样有创造力吗?

创造力是推动社会发展和创新的关键,但要评估它却是一项繁芜且每每带有主不雅观判断的任务。

随着前辈的天生式AI模型崛起,越来越多过去被认为只有人类创造力才能做到的事情,都能被这些模型轻松搞定。

最近,由新加坡国立大学、斯坦福大学、谷歌DeepMind、罗格斯大学、微软研究院和哥伦比亚大学组成的联合团队,提出了一个名为「相对创造力」(Relative Creativity)的全新观点来办理议义和评价创造力的难题。

除了界定和剖析了可度量的创造力,研究职员还提出了一套切实可行的演习辅导原则,有效地连接了创造力的理论量化和模型演习的实际操作。

末了,研究职员为评估和促进AI模型的统计创造力,建立了一个连贯、不断演进和变革性的框架。

论文地址:https://arxiv.org/abs/2401.01623

在这里,研究职员不再试图给创造力下一个普遍性的定义,而是转而磋商AI是否能够达到一个假想人类的创造能力水平。

这个新视角受到了图灵测试的启示,该测试是判断机器是否能够像人类一样思考的标准,并在此根本上扩展,从而应对评价创造力时固有的寻衅和主不雅观性问题。

这种方法论上的转变,使得研究职员可以利用统计创造力(Statistical Creativity)这一观点,对AI的创造力进行统计上的量化评估,进而直接比较AI和人类在创造力上的差异。

在此根本上,研究职员还进一步磋商了如何将统计创造力运用到具有提示技巧(prompting paradigm)的当代自回归模型中。

相对创造力(a)和统计创造力(b)

论文作者一手Q&A

问题 1:这篇论文紧张关注什么内容?

回答:论文紧张构建了一个详细的框架,旨在探索人工智能(AI)的创造力。
它提出了相对创造力(Relative Creativity)和统计创造力(Statistical Creativity)这两个观点,目的是剖断AI是否能够达到人类的创造性水平。
论文强调的是对AI创造力的比较性评价,而不是给创造力下一个绝对的定义。

问题 2:什么是相对创造力?

回答:相对创造力是评价AI创造力的一个新观点,它通过将AI产出的作品与一个假想但符合现实的人类创作者在相同背景影响下所创作的作品进行比较。
如果AI模型能创作出与人类创作者的作品无法区分的作品,那么这个模型就可以被认为具有相对创造力,这一评定是由评估者来决定的。

问题 3:为什么AI创造力的主不雅观性很主要,论文是如何谈论这个问题的?

回答:创造力的主不雅观性至关主要,由于不同的文化、学科和个体对创造性的定义可能截然不同。
论文通过在评估AI创造力时引入相对视角来处理这个问题,即把AI的创意产出与特殊挑选的人类参照物进行比拟。
在选择这个参照的人类时,就融入了多元的创造性不雅观点和标准。
这种方法使得对AI创造力的研究能够保持一定的客不雅观性。

问题 4:这种对创造力的理解与打算机科学和认知科学的早期研究有何不同,它又是如何表示图灵测试的理念呢?

回答:与打算机科学和认知科学中的传统方法不同,这种理解创造力的方法采纳了相对评估而非绝对定义。
就像图灵测试通过比较机器行为与人类反应来评估智能,而不是坚持一个固定的定义一样,相对创造力通过将AI的创作与一个假想的人类创作者的作品进行比较来评估AI。
这种比较方法有效地避免了建立一个通用创造力定义的繁芜性,转而集中于更实际的目标:判断AI是否能在类似的情境下复现人类的创造才能。

问题 5:统计创造力如何帮助评估相对创造力?

回答:统计创造力是一种评估方法,它让我们能够实际和现实地评估相对创造力。
这种方法通过比较AI根据提示所做的创作与真实人类创作者的作品,并采取一种分布间隔的度量办法来判断AI模型是否能够模拟特定人群的创造才能。

问题 6:如何反响和量化AI创造力的不同层次?

回答:AI的不同创造力层次可以通过选择具有不同创造水平的人类群体(目标分布)来展现。
例如,比较AI与儿童的创造力和将AI与博士研究员的创造力作为对照,会得到不同的评估结果。
AI的创造力可以表现为大略模拟(如复制已有的数据分布),也可以是模拟日凡人类的行为,乃至实现高创造力个体的复刻。
这一理论为我们供应了一个控和实现这些不同创造力层次的框架,通过选择得当的人类创造力分布来实现。

问题 7:统计创造力丢失(Statistical Creative Loss)是什么,它如何促进对AI创造力的研究?

回答:统计创造力丢失是一种新提出的丢失函数,它基于理论原则来辅导实际的AI模型演习,以培养具有创造性的AI。
这个观点帮助我们理解如何优化演习目标和选择得当的创造者与作品的匹配,目的是根据统计创造力(Statistical Creativity)的理念,增强AI模型的创造性能力。

参考资料:

https://www.nytimes.com/2024/01/04/technology/ai-chatgpt-images-memes.html

https://weibo.com/3229962754/NzbQSs9G7

https://arxiv.org/abs/2401.01623