很多小伙伴在考试测验用AI写网文的时候,都会碰着这样的问题:AI刚开始写出来的东西可能还不错,写着写着就涌现措辞浅白、生硬的问题。
当篇幅拉长之后,AI就开始重复、排比,大量内心独白,胡乱堆笔墨,进入抽风的状态。

那么,有没有什么办法,能让AI的文风保持住?

要办理这个问题,我们首先须要来剖析一下,涌现这种问题可能的缘故原由,才好对症下药。

目前AI能写的文章类型很多,小到小红书/朋友圈文案、短诗,大到"大众号文章、论文。
AI处理逻辑性强、知识梳理类的文章能力很不错,比如天生邮件正文、会议纪要、论文之类的。
AI本身的措辞风格也很贴合这类内容。

去AI味儿大年夜作战AI到底能不能写出风格稳定的网文

但在创作故事、输出较感性的文案方面,AI会出各种问题,开篇讲到的情形便是范例表示。
我认为缘故原由在于,故事类内容中有逻辑性,但逻辑性不是故事的核心驱动力,并且故事中绝大部分内容须要去虚构、无中生有,这实在是和天生前述文章类型非常不同的能力。
虚构≠瞎编,这种知识的综合利用,内里隐含的决策机制非常繁芜,人脑可以轻松做到,却很难归纳成123,只可融会不可言传,远不是现有AI能完备节制的。

因此,我们可以考虑以下几个方面来办理:

从文风层面上,是不是能让AI去深入学习网文的风格,理解网文用词、句式、对话、描写、分段等各个方面的特点,利用风格的约束,避免乱写的情形涌现。
从提问层面上,还是得化整为零,让AI实行的任务更聚焦,别让AI一次天生过多内容,看看这样是不是会好些。

如此,我们可以有三套方案,分别面向AI chat、智能体、AI写作软件,看看效果如何。

总体思路

这次测试紧张目的,是想探究作为普通的网文作者,如何利用AI产品才能使AI天生的网文风格更加稳定,减少AI胡言乱语摧残浪费蹂躏韶光的情形。

虽然面向的是三类不同AI产品,但这次测试的总体思路有一定相似性,紧张包括以下几个方面:

1.我们先找到某位高产作者的作品,扒一部分内容下来喂给AI去学习

这里不会扒全本,而是掌握在几万字旁边。
由于我们的目的不是演习一套大模型用来写网文,而是希望AI能按照稳定的风格(或者说作者自己的风格)来行文,如此可供AI学习的内容体量常日不会太大。

2.找到这位作者的最新作品,描述对应的故事梗概给AI来写,看AI能写成什么样

分块天生正文,少量多次,每次只管即便掌握在1000字以内,再将天生的内容拼装好。
以这样的办法试写出两章,看看AI还会不会抽风,写出来的内容和原作者风格的差别究竟有多大。

3.准备对照组

既然要测效果,对照组当然少不了。
这里我按照示例的字数,将每套方案中的测试工具分为4组,分别是0k(不供应示例)、2k(供应约2k字的示例)、10k(供应约1万字的示例)、50k(供应约5万字的示例)。
示例便是前面讲的高产作者已有的作品。

4.准备考验标准

如何衡量AI天生的内容风格相似度?我找来了鲁迅的《孔乙己》和《狂人日记》,及朱自清的《背影》三篇文章,然后分别上传至Kimi请AI剖析其措辞风格的相似度。

提问:【上传文件】请帮我检测这两篇文章措辞风格的相似度,并见告我如果满分是100分,这两篇文章措辞风格相似度是多少分?

Kimi给出《孔乙己》和《狂人日记》的措辞风格相似度是70,《孔乙己》和《背影》措辞风格的相似度是40。
以是,后续我们可以以这两个分值作为参考,用来评估原文和AI天生内容的相似度。

为啥选择这样的思路呢?实在关键在于现在的AI太傻了。
更智能的办法AI做不到,更风雅的办法一样平常网文作者接管不了。
以是,不管是总体思路还是后续详细的测试方案,都须要寻求一个既不算太麻烦,又能产生好结果的平衡。

方案1:用AI chat仿写

用AI chat仿写,即上传网文示例,然后让AI参考示例的风格来写小说。

常日有两种做法,一个是上传文件后,直接给出故事梗概,让AI仿照示例风格来写。
第二种办法是先上传文件,让AI归纳文章的措辞风格,然后再哀求AI按照此种风格来写。

我的提问列表如下:

直接仿写

无示例版

请你扮演一位专业的网文作者,按照如下故事梗概写出小说正文:

(略)

哀求:

1.以对话、描写为主,让故事更具有画面感

2.结合故事梗概扩展细节,确保细节丰富、情节连贯

3.输出正文内容不少于500字,结尾不要涌现感悟和总结性的内容,等待我给你后续的故事梗概

含示例版

【上传文件】请你扮演一位专业的网文作者,以上是你曾经写过的网文,请你严格按照这篇文章的措辞风格,写出小说正文,故事梗概如下:

3.输出正文内容不少于500字,结尾不要涌现感悟和总结性的内容,等待我给你后续故事的梗概

追问

请按照如下故事梗概,连续写出后续的故事:

(略)

哀求如下:

1.措辞风格必须和上面保持同等

2.以对话、描写为主,让故事更具有画面感

3.结合故事梗概扩展细节,确保细节丰富、情节连贯

4.输出正文内容不少于500字,结尾不要涌现感悟和总结性的内容,等待我给你后续的故事梗概

……(重复追问,直至写完2章内容)

归纳后仿写

提问

【上传文件】请你剖析这篇文章的措辞风格,并详细先容这种措辞风格的特点

追问

请你扮演一位专业的网文作者,严格按照这样的措辞风格写出小说正文,故事梗概如下:

全部天生完毕后,将天生的内容片段,按照各自分组组装起来,然后,将天生的各个版本完全正文(2章)与作者原版作品的前2章比拟,同样由Kimi来打分,措辞风格相似度得分如下:

直接仿写

归纳后仿写

AI剖析措辞风格打分的时候,重点考虑了主题和情节走向,虽然我后面调度了问题哀求忽略这块,但AI并没咋听进去,得分还是高得离谱。
这样的偏差对终极得分影响比较大,导致结果与预期严重不符。
(╯#-_-)╯~~~~~~~╧═╧ 这鬼分数,我怎么就不信呢……

算啦算啦,AI不怎么靠谱,还是得靠自己!
我来给大家剖析下几组天生正文的结果情形吧:

直接仿写

0k空缺对照组

0k版措辞风格较为平实,从第二个片段开始,结尾部分涌现范例的AI味儿段落。
随着轮次变多,AI味儿内容占的篇幅越来越多,包括累赘的内心独白、重复的句子/段落等。
在故事扩展上,涌现了某些片段AI为了凑字数,自动续写后续情节的情形,导致两个片段故事衔接上涌现问题。

2k版

2k直接仿写版,开篇的措辞风格、人物展现出来的面貌,和0k版有了较大差异。
行文风格上已经能明显觉得到它在向示例靠拢,且AI味儿内心独白之类的内容比例大幅减少,只在后面三块情节片段的结尾涌现。
其余,出了个bug,第二块涌现了大面积重复,天生的1600+字中,只有前350+字是可用的,后面全部是重复前面的笔墨。

10k版

10k直接仿写版,涌现了让人意想不到的状况,剧情完备跑偏了,生生按照同样的故事梗概写出了不一样的故事和人物关系。
从文风上来说,这一版相较于0k版还是有较大改进的,偶尔有一些AI味的内心独白、展望未来涌如今片段末端,占比不是很大。
相较于2k直接仿写版的改进则不是很明显。

50版

50k直接仿写版写出来的内容让人很迷惑,由于它险些犯了前面几版所有的缺点,AI味儿内心独白、重复等所占的篇幅较之2k和10k的直接仿写版更多,比0k版少一点。
和10k版一样,情节和人物关系完备跑偏,且个中掺杂进来了很多无意义的人物交互(没有什么情节,便是这些龙套提一嘴又消逝,表达一下对主角的关心)。
不测不知道,一测让人大失落所望。
归纳后仿写

2k版

2k归纳后仿写天生的内容,和2k直接仿写版差不多,不管是文风还是人物的性情都很相似。
这一版中扩展了一个主要配角,用来演绎故事梗概中的一些情节,算是一个创新点吧。
至于AI风格的内心独白、重复之类的状况,会比2k直接仿写版多一点,总体占比还是比较低的。

10k版

10k归纳后仿写版切实其实不要太离谱~

这一版在文风上,我认为是比10k直接仿写版更靠近原作的,但涌现了新的问题,便是后面轮次的对话天生的内容,会涌现与前面轮次重复的情形。
不是衔接处重复提点前情,而是在结尾处重复前一轮结尾的内心独白,且重复了好几遍,神奇的callback。
当然啦,10k直接仿写版涌现的剧情跑偏问题同样存在,这里还涌现了前后人设崩坏的情形,逻辑很混乱。

50k版

50k归纳后仿写版,比之前的所有版本都要离谱。
怎么说呢?可能是彻底被AI腌入味儿了吧。
情节和人物完备跑偏,加入很多无意义的人物和情节,以及见缝插针涌现的AI味儿内心独白。
我觉得乃至不如0k版的表现,辣眼睛。

以上是AI chat的测试结果。
这便是为啥我觉得AI打分极度不靠谱的缘故原由,看AI打分和人工剖析,完备是两码事。

从AI chat的测试情形来看,有几点结论:

采取仿写的办法,确实会比然AI直接按照故事梗概行文效果好,天生的笔墨内容风格更加稳定,减少了AI味儿。
示例篇幅并不是越大越好,2k、10k、50k篇幅示例供应参考的效果递减,这一点出乎我的预见。
随着轮次变多,AI写正文质量也在快速低落,非常明显。
乃至不须要太多轮次,这个问题就涌现了。
AI每次天生内容,都觉得它认为自己是末了一次为你做事一样,非得来个畅想美好未来的结尾,戏很多且无法让它闭嘴。

总体来说,我认为AI chat用来写正文不是个好选择,真的太随意马虎抽风了,文风极度不稳定。
AI chat适宜做一些碎片化的、浅层的、强逻辑性的事情,或是天生一些创意点子,写文就算了吧,它完备hold不住啊~

本文由大家都是产品经理作者【不知】,微信"大众号:【不知】,原创/授权 发布于大家都是产品经理,未经容许,禁止转载。

题图来自Unsplash,基于 CC0 协议。