请看下面两段笔墨:
“The mirror of Borges. Summer, so I thought, I looked by drawing to reason. The mirrors preceded him out. The voice was the river of a few monstrous magnificent spirit of false form.”
“This day she has a commodity interest that my protection was the bearing a short an old acquaintance of her hands, and she was at the side of the death that are the same time and bringing him. Give me settled by these weeks to hear her for his whole fairy and fortune to be in the court of the same time.”
这两段跳跃的、因果割裂的笔墨,是不是让你看得一头雾水?以上笔墨由两位不同用户,揭橥在 Literai 网站上,后者是由 3 位个人开拓者在 2016 年建立的 AI 小说创作项目。Literai 供应了从如何演习神经网络模型到末了天生笔墨的详细操作指南,普通人也可以用 AI 写出自己想要的小说。
虽然天生的文章有着这样那样的问题,两位用户对此倒还算满意。第一个以阿根廷作家博尔赫斯的全部小说集作为数据集,用 512 个神经元和两个隐蔽层演习神经网络,经由 19850 次迭代得到了这篇文章。
第二个网友则用了自己最迷恋的英国作家简·奥斯汀和一点点玛丽·雪莱的作品。在天生《Of Crying and Captains 》之前,电脑跑了一整天,“对付这个模型的创建来说,语气和句子构造是最主要的两件事。当我阅读这篇文章时,我真切地感想熏染到英国的聪慧正悄悄潜入我的内心。”该用户表示。
用 AI 创作你的故事
Literai 的发展与同人文化还有着一定关系。
左:Anthony Voutas 右:Myles O’Neill
2016 年,神经网络在前面几年取得长足进步,在湾区有三位志同道合的年轻人——他们分别是在 Kaggle 的 Myles O’Neill,以及其它科技创业公司的 Anthony Voutas 和 sadora Lamego,一起操持做一个让更多人参与感想熏染 AI 的项目。
雷锋网理解到,Myles O’Neill、Anthony Voutas 研究生都就读于澳洲国立大学打算机专业,期间学习过神经网络,而 sadora Lamego 当时正在伯克利大学开设了同人小说的课程。头脑风暴后,他们意识到,有可能并且想要创造自己的神经网络来写故事。
其余,该网站上现存的像模像样的几篇小说都是同人作品,除了前文提到的,还有《Harry Potter and the Cream Cake Of Dumbledore 》《The Adventures of Cyborg Holmes》 《South Park: Deeper & Harder》、《Return of the Computer Jedi 》等。网站彷佛没有审核机制,有网友上传的无意义的笔墨,也有人直接上传了《杀去世一只知更鸟》这本书的前几章。
接下来就让我们看看详细怎么操作的吧。
作者们供应了 Mac 和 Windows 两个版本的操作指南,不过第一步都是相同的,须要安装 Docker,由于必须有 Hyper-V,以是如果是 Windows 版本,必须是 Windows 专业版及更高才行。;
第二步是创建数据库。神经网络刚开始对拼写、标点、单词字符、情节、语法知识都一窍不通,须要从零开始从给它的素材中学习这些观点。个中重点要学的是更奇妙的部分,比如文风或构造。你喂给它莎士比亚,它就会写出莎士比亚风。
背后的关键技能便是是非期影象神经网络( long short-term memory neural network)。它一次创建一个字符的内容,每个新字符都是基于它已经学习的内容。
网站提到,用户可以从谷歌、Project Gutenberg、IMSDB、MLDB 数据库,或者是其它用户所附带的数据文件等获取演习数据集。一样平常来说,数据集越大,AI 写得更好。1MB (200000字)是最低的哀求。3-10MB 是合理的范围,10 或 100MB 就算得上大数据集,则更空想,当然在个人 PC 演习可能须要几周乃至几个月的韶光。
第三须要预处理数据,调度一些参数。
第四启动 Docker,将数据文本复制到 Docker 容器中,然后开始演习。把稳保持电脑充电且不休眠。由于作者发布网站较早,指引中用的是 torch-rnn。几小时或几天后,用户会收成一个合乎心意的神经网络模型,输入命令,小说就会出身了。
目前网站上传都是英文小说,理论上也可以通过学习其他措辞作品来用其他措辞写作。作者也指出,目前写出来的文章还是颇为生硬,但是它最强的一点是可以比较深刻地洞察和模拟素材库的模式与文风。
2019 年 2 月,OpenAI 发布了自己具有 15 亿个参数的措辞模型 GPT-2,当时它就展示了颇为惊人的短句续写成能力。最近有位网友就用这个模型跑了一遍,天生了一段笔墨揭橥在该网站上,与作者当时用的 torch-rnn 写出来的笔墨比较,无疑有很大的进步,不仅高下文联系、有层层递进的对话,语法还险些没有缺点,有点以假乱真了。
It was a woman who was wearing a black dress and glasses.She was standing in front of the door, and she was looking at me.
I smiled and said to her:\"大众I am L'Lambda.\"大众
\公众Oh, hey, hey! You look like an adventurer, aren't you?\公众
\"大众I am L'Lambda the Demon Lord.\"大众
\"大众Who is that?\"大众 The woman asked. She had heard and admired L'Lambda's fighting skills and strength.
\公众I have been holding this girl for two years now. This is a slave that I have bought from a man. She has been with me for two years now, and I am holding her now.\公众
\公众What kind of a place this is?\公众
\"大众I have heard that L'Lambda has been living in a mansion in a mountain outside of the Kingdom of Altdorf that is very large. It is said that there is a lot of money here.\公众
\公众There is?\"大众
\"大众Of course.\公众
机器文学的发展和争议事实上,AI,或者更广义的机器文学创作,在这一波 AI 复兴之前就存在。如果负责区分,还有程序写作 Program Writing,利用打算机程序来天生笔墨;电脑天生文学 Computer-Generated Literary Art,紧张是打算机与文学方面的结合,偏艺术创作。而人工智能、机器学习的发展,则是供应了一个更好的工具。
以上图书都有电脑程序写作的部分
Myles O’Neill 曾在项目 Github 页面上提过一句,操持运用这个产品参加 2016 年的 NaNoGenMo 故事。
雷锋网理解到,NaNoGenMo 全称 National Novel Generation Month,是一年一度的写作机器人峰会,第一次在 2013 年 11 月举办,拥有程序员+艺术家双重身份的 Darius Kazemi 心血来潮将想法揭橥在推特上,得到了许多支持,他就在 GitHub 建立了一个仓库。
峰会名称来源于国家小说写作月 NaNoWriMo(National Novel Writing Month),同时也沿用了其两条规则:作品必须在 30 天内完成,而且至少要写够 5 万字(官方 Github:https://github.com/NaNoGenMo)。NaNoGenMo 一贯开到 2019 年,去年的主题是与爱贯串衔接。
在 NLP、神经网络发展之前的 2014 年,大多数的作品都是利用创造性的规则转换已有的文本,这也导致了作品的相似性。
搜索者
2014 年有一篇作品叫《搜索者》,作者 Thricedotted 利用了梦幻般的办法去探索机器智能的奇异之美。这是一本试图通过阅读维基百科来理解人类行为的机器的自传。笔墨充斥着视觉美感,用抽象的雨点来给每一次算法操作的循环加标注。文章常常是割裂的,而美感也来自于阅读者感想熏染到的片段式意境。
而随着 AI 复兴,在文章写作之外,人们还将 AI 延伸到了更广泛的文学艺术领域。比如在文学的明珠诗歌领域,微软 2014 年起开始研究虚拟机器人小冰,她第一次破圈便是以少女墨客的身份,写出过“爱情就像脂肪,是点点滴滴的积累”,并在 2017 年出了一本名为《阳光失落了玻璃窗》的诗集,如今已经更新到第七代。
一个叫作 Benjamin 的 AI 在 2016 年伦敦科幻电影节上用 48 小时创作了名为《Sunspring》的短片,两年后又花两天制作了一部叫作《Zone Out》的微电影。
Zone Out 微电影截图,有网友表示风格类似 David Lynch
雷锋网理解到, 清华孙茂松教授带领学生推出了一个 AI 作诗系统九歌(http://jiuge.thunlp.cn/cangtou.html),2015 年底开始开拓,2019 年 7 月宣告开源。
藏头诗
以上项目的事理也类同 Literai,基于 LSTM 学习大量文本数据。小冰的当代诗创作能力,是通过对 1920 年后 519 位当代墨客的上千首诗反复学习(术语称为迭代)10000 次达成的。Benjamin 则接管了几十个拍摄于 1980 至 1990 年代的科幻电影剧本。
而与此同时,AI 文学的差评也开始多了起来。小冰风头最盛,批评也最多。《阳光失落了玻璃窗》的诗集豆瓣评分 5.5 分,批评紧张聚焦在:写诗是人类精神的表达,而小冰的诗没有灵魂和情绪,只是大略地堆砌笔墨,缺少内在的抒怀逻辑。
有墨客表示,“无论输入多少句子还是写不了真诗,真诗是有灵性的。”“‘小冰’成功地学会了新诗的糟粕,写的都是谰言。”
在现阶段,与其说机器是在创作,不如说是在随机性地排列组合笔墨。过去、现在的主流不雅观点一贯都是,科技、逻辑、理性不是统统,永久无法超越文学艺术。刘慈欣的一篇短篇小说《诗云》曾对这种情形做出过终极猜想。
无所不能的神级文明代表,立志写出超越李白的诗。方法一是写出超越李白的诗,但由于缺少对美的理解,折戟;方法二,穷尽所有笔墨,写完所有的诗。 他大手笔地用全体太阳系的物质能量来存储所有的诗,太阳熄灭、重燃 11 次后,在原来太阳系的位置,涌现了一片直径为一百个天文单位的旋涡状星云。
而末了,神却抽泣着承认失落败,由于他纵然写出了顶峰的诗,却无法从诗云中筛选出来。
“聪慧生命的精华和实质,是技能所无法触及的。”
参考:
https://arcade.stanford.edu/blogs/nanogenmo-dada-20
https://www.literai.com/story/2d97fec855
http://www.ce.cn/culture/gd/201705/30/t20170530_23321994.shtml
https://zhuanlan.zhihu.com/p/30640458?from_voters_page=true