这是 Deep-speare 人工智能程序“创作”的十四行诗。
暂且不说 Deep-speare“作品”的质量如何,至少在节奏、押韵以及语法方面,这一小节十四行诗的表现都非常不错,足以迷惑不少人。这也正是一些研究团队创造,大多数读者无法区分人工智能天生的诗歌和人类创作诗歌的缘故原由。
Deep-speare 团队包括三名机器学习研究职员和一名文学学者组成,他们用了大约 2700 首十四行诗,约 36.7 万个单词来演习这个人工智能“墨客”,让它学会自己“创作”。
大略来说便是,Deep-speare 通过深度学习来对演习数据库中的诗歌进行筛选,一次又一次地考试测验创造出与样本匹配的诗句。
只管以前在一些类似项目中,研究职员会提前给人工智能运送押韵、节奏等方面的知识,但 Deep-speare 独立地学习了十四行诗写作干系的三大要素:节奏、韵式和自然的措辞(即单词精确流畅地组合在一起)。
详细来说,Deep-speare 的系统由三个部分组成:一个节奏模型,一个韵式模型,以及一个确保语法精确的自然措辞模型,个中,自然措辞模型是最紧张的部分。
首先,措辞模型会对语料库(语料库的内容基于维基百科词条、Reddit 话题,以及一些专门为构建的数据库)中单词进行筛选和预测,判断哪些单词是适宜组合在一起成为句子的。经由适当的演习后,措辞模型会授予流利的句子高评分,授予无意义的句子低评分。
措辞模型的质量则可以通过不雅观察下一个单词(从右往左)的关联性强度来提现。比如“San-Francisco”常常同时涌现,“coffee”常常与“refresh”或“life-giving”等单词的关联性更强,而反面“powerful”或“light”等词有关。如果措辞模型能够精确处理这些信息,那么,就可以认为这个模型已经在很大程度上捕获了措辞的繁芜性。
一旦措辞模型演习有素之后,从零开始天生一个句子就不再是难事,重复这一步骤就能实现创作十四行诗的根本。
除了单词和句子,Deep Speare 还要学习节奏,即不雅观察每一行中的字母和标点符号,并确定哪些字符对应哪些音节,哪些音节接管重音。例如,单词“summer”该当被理解为两个音节,重音情形也有所不同——重读的“sum”和不重读的“mer”。
当 Deep-speare 写十四行诗时,措辞模型会天生候选诗行,韵律模型再从中挑选出符合节奏的诗行,然后重复这一过程。
当然,还有韵式模型。这个模型只关注每一行诗的末了一个单词,尽可能地实现单词押韵。比如,“day”和“may”,“temperate”和“date”。
在检讨诗歌输出时,研究团队创造, Deep-speare 天生的诗歌短语与演习数据并没有太多重叠。也便是说,它并没有对演习数据进行影象,然后直接从中复制,而是创作了具有原创意义的诗歌。然而,这并不能解释诗歌在文学方面的质量。
为此,研究团队找来了两批评委,让评委分辨人类和机器创作的十四行诗。
第一批是亚马逊 Mechanical Turk 雇佣的众包工人,他们只会基本的英语,但没有诗歌方面的专业知识。终极的结果是,工人们以 50% 的准确率猜出人类诗歌和机器诗歌。不过,这一数据可能虚高,由于工人们可能在网上对诗歌节选进行了搜索,人类诗歌会涌现搜索结果反馈,而机器诗歌不会涌现。
第二个评委是多伦多大学的文学助理教授 Adam Hammond。这一次,评判的办法是对人机合写的十四行诗的韵律、节奏、可读性和情绪影响等四大属性进行评分。结果,Adam Hammond 对 Deep-speare 的节奏和韵式给予了极高的评价,乃至超越人类(由于墨客常常为了达到某种效果而特意不遵照规律);在可读性和情绪方面,Deep-speare 则略逊一筹,文学专家一眼就能看出来哪些出自莎士比亚之手,哪些来自 AI 墨客。
当前,研究团队正在努力提高人工智能墨客在可读性和情绪影响方面的表现。
另一方面,人类墨客在创作前并不会端坐在桌前思考,“嗯,我的第一个词该当是什么?”然后,在做出这个困难的决定之后,再绞尽脑汁想第二个词。相反,墨客头脑中会有一个预想的主题,然后探求词语来表达这个想法。
研究团队已经朝这个方向迈出了一步,通过授予 Deep-speare 能力来天生基于特定主题的诗歌,比如爱或失落去。而且,坚持一个主题可以增加四行诗的连贯性,模型可选择的词汇也将受到主题的限定。
毫无疑问,这是一个年夜志勃勃的项目。雷锋网雷锋网
雷锋网注:本文编译自 IEEE Spectrum