很多小伙伴在考试测验用AI写网文的时候,都会碰着这样的问题:AI刚开始写出来的东西可能还不错,写着写着就涌现措辞浅白、生硬的问题。当篇幅拉长之后,AI就开始重复、排比,大量内心独白,胡乱堆笔墨,进入抽风的状态。
那么,有没有什么办法,能让AI的文风保持住?
要办理这个问题,我们首先须要来剖析一下,涌现这种问题可能的缘故原由,才好对症下药。
目前AI能写的文章类型很多,小到小红书/朋友圈文案、短诗,大到"大众号文章、论文。AI处理逻辑性强、知识梳理类的文章能力很不错,比如天生邮件正文、会议纪要、论文之类的。AI本身的措辞风格也很贴合这类内容。
但在创作故事、输出较感性的文案方面,AI会出各种问题,开篇讲到的情形便是范例表示。我认为缘故原由在于,故事类内容中有逻辑性,但逻辑性不是故事的核心驱动力,并且故事中绝大部分内容须要去虚构、无中生有,这实在是和天生前述文章类型非常不同的能力。虚构≠瞎编,这种知识的综合利用,内里隐含的决策机制非常繁芜,人脑可以轻松做到,却很难归纳成123,只可融会不可言传,远不是现有AI能完备节制的。
因此,我们可以考虑以下几个方面来办理:
从文风层面上,是不是能让AI去深入学习网文的风格,理解网文用词、句式、对话、描写、分段等各个方面的特点,利用风格的约束,避免乱写的情形涌现。从提问层面上,还是得化整为零,让AI实行的任务更聚焦,别让AI一次天生过多内容,看看这样是不是会好些。如此,我们可以有三套方案,分别面向AI chat、智能体、AI写作软件,看看效果如何。
总体思路
这次测试紧张目的,是想探究作为普通的网文作者,如何利用AI产品才能使AI天生的网文风格更加稳定,减少AI胡言乱语摧残浪费蹂躏韶光的情形。
虽然面向的是三类不同AI产品,但这次测试的总体思路有一定相似性,紧张包括以下几个方面:
1.我们先找到某位高产作者的作品,扒一部分内容下来喂给AI去学习
这里不会扒全本,而是掌握在几万字旁边。由于我们的目的不是演习一套大模型用来写网文,而是希望AI能按照稳定的风格(或者说作者自己的风格)来行文,如此可供AI学习的内容体量常日不会太大。
2.找到这位作者的最新作品,描述对应的故事梗概给AI来写,看AI能写成什么样
分块天生正文,少量多次,每次只管即便掌握在1000字以内,再将天生的内容拼装好。以这样的办法试写出两章,看看AI还会不会抽风,写出来的内容和原作者风格的差别究竟有多大。
3.准备对照组
既然要测效果,对照组当然少不了。这里我按照示例的字数,将每套方案中的测试工具分为4组,分别是0k(不供应示例)、2k(供应约2k字的示例)、10k(供应约1万字的示例)、50k(供应约5万字的示例)。示例便是前面讲的高产作者已有的作品。
4.准备考验标准
如何衡量AI天生的内容风格相似度?我找来了鲁迅的《孔乙己》和《狂人日记》,及朱自清的《背影》三篇文章,然后分别上传至Kimi请AI剖析其措辞风格的相似度。
提问:【上传文件】请帮我检测这两篇文章措辞风格的相似度,并见告我如果满分是100分,这两篇文章措辞风格相似度是多少分?
Kimi给出《孔乙己》和《狂人日记》的措辞风格相似度是70,《孔乙己》和《背影》措辞风格的相似度是40。以是,后续我们可以以这两个分值作为参考,用来评估原文和AI天生内容的相似度。
为啥选择这样的思路呢?实在关键在于现在的AI太傻了。更智能的办法AI做不到,更风雅的办法一样平常网文作者接管不了。以是,不管是总体思路还是后续详细的测试方案,都须要寻求一个既不算太麻烦,又能产生好结果的平衡。
方案1:用AI chat仿写
用AI chat仿写,即上传网文示例,然后让AI参考示例的风格来写小说。
常日有两种做法,一个是上传文件后,直接给出故事梗概,让AI仿照示例风格来写。第二种办法是先上传文件,让AI归纳文章的措辞风格,然后再哀求AI按照此种风格来写。
我的提问列表如下:
直接仿写
无示例版
请你扮演一位专业的网文作者,按照如下故事梗概写出小说正文:
(略)
哀求:
1.以对话、描写为主,让故事更具有画面感
2.结合故事梗概扩展细节,确保细节丰富、情节连贯
3.输出正文内容不少于500字,结尾不要涌现感悟和总结性的内容,等待我给你后续的故事梗概
含示例版
【上传文件】请你扮演一位专业的网文作者,以上是你曾经写过的网文,请你严格按照这篇文章的措辞风格,写出小说正文,故事梗概如下:
3.输出正文内容不少于500字,结尾不要涌现感悟和总结性的内容,等待我给你后续故事的梗概
追问
请按照如下故事梗概,连续写出后续的故事:
(略)
哀求如下:
1.措辞风格必须和上面保持同等
2.以对话、描写为主,让故事更具有画面感
3.结合故事梗概扩展细节,确保细节丰富、情节连贯
4.输出正文内容不少于500字,结尾不要涌现感悟和总结性的内容,等待我给你后续的故事梗概
……(重复追问,直至写完2章内容)
归纳后仿写
提问
【上传文件】请你剖析这篇文章的措辞风格,并详细先容这种措辞风格的特点
追问
请你扮演一位专业的网文作者,严格按照这样的措辞风格写出小说正文,故事梗概如下:
全部天生完毕后,将天生的内容片段,按照各自分组组装起来,然后,将天生的各个版本完全正文(2章)与作者原版作品的前2章比拟,同样由Kimi来打分,措辞风格相似度得分如下:
直接仿写
归纳后仿写
AI剖析措辞风格打分的时候,重点考虑了主题和情节走向,虽然我后面调度了问题哀求忽略这块,但AI并没咋听进去,得分还是高得离谱。这样的偏差对终极得分影响比较大,导致结果与预期严重不符。(╯#-_-)╯~~~~~~~╧═╧ 这鬼分数,我怎么就不信呢……
算啦算啦,AI不怎么靠谱,还是得靠自己!
我来给大家剖析下几组天生正文的结果情形吧:
直接仿写
0k空缺对照组
0k版措辞风格较为平实,从第二个片段开始,结尾部分涌现范例的AI味儿段落。随着轮次变多,AI味儿内容占的篇幅越来越多,包括累赘的内心独白、重复的句子/段落等。在故事扩展上,涌现了某些片段AI为了凑字数,自动续写后续情节的情形,导致两个片段故事衔接上涌现问题。
2k版
2k直接仿写版,开篇的措辞风格、人物展现出来的面貌,和0k版有了较大差异。行文风格上已经能明显觉得到它在向示例靠拢,且AI味儿内心独白之类的内容比例大幅减少,只在后面三块情节片段的结尾涌现。其余,出了个bug,第二块涌现了大面积重复,天生的1600+字中,只有前350+字是可用的,后面全部是重复前面的笔墨。
10k版
10k直接仿写版,涌现了让人意想不到的状况,剧情完备跑偏了,生生按照同样的故事梗概写出了不一样的故事和人物关系。从文风上来说,这一版相较于0k版还是有较大改进的,偶尔有一些AI味的内心独白、展望未来涌如今片段末端,占比不是很大。相较于2k直接仿写版的改进则不是很明显。
50版
50k直接仿写版写出来的内容让人很迷惑,由于它险些犯了前面几版所有的缺点,AI味儿内心独白、重复等所占的篇幅较之2k和10k的直接仿写版更多,比0k版少一点。和10k版一样,情节和人物关系完备跑偏,且个中掺杂进来了很多无意义的人物交互(没有什么情节,便是这些龙套提一嘴又消逝,表达一下对主角的关心)。不测不知道,一测让人大失落所望。归纳后仿写
2k版
2k归纳后仿写天生的内容,和2k直接仿写版差不多,不管是文风还是人物的性情都很相似。这一版中扩展了一个主要配角,用来演绎故事梗概中的一些情节,算是一个创新点吧。至于AI风格的内心独白、重复之类的状况,会比2k直接仿写版多一点,总体占比还是比较低的。
10k版
10k归纳后仿写版切实其实不要太离谱~
这一版在文风上,我认为是比10k直接仿写版更靠近原作的,但涌现了新的问题,便是后面轮次的对话天生的内容,会涌现与前面轮次重复的情形。不是衔接处重复提点前情,而是在结尾处重复前一轮结尾的内心独白,且重复了好几遍,神奇的callback。当然啦,10k直接仿写版涌现的剧情跑偏问题同样存在,这里还涌现了前后人设崩坏的情形,逻辑很混乱。
50k版
50k归纳后仿写版,比之前的所有版本都要离谱。怎么说呢?可能是彻底被AI腌入味儿了吧。情节和人物完备跑偏,加入很多无意义的人物和情节,以及见缝插针涌现的AI味儿内心独白。我觉得乃至不如0k版的表现,辣眼睛。
以上是AI chat的测试结果。这便是为啥我觉得AI打分极度不靠谱的缘故原由,看AI打分和人工剖析,完备是两码事。
从AI chat的测试情形来看,有几点结论:
采取仿写的办法,确实会比然AI直接按照故事梗概行文效果好,天生的笔墨内容风格更加稳定,减少了AI味儿。示例篇幅并不是越大越好,2k、10k、50k篇幅示例供应参考的效果递减,这一点出乎我的预见。随着轮次变多,AI写正文质量也在快速低落,非常明显。乃至不须要太多轮次,这个问题就涌现了。AI每次天生内容,都觉得它认为自己是末了一次为你做事一样,非得来个畅想美好未来的结尾,戏很多且无法让它闭嘴。总体来说,我认为AI chat用来写正文不是个好选择,真的太随意马虎抽风了,文风极度不稳定。AI chat适宜做一些碎片化的、浅层的、强逻辑性的事情,或是天生一些创意点子,写文就算了吧,它完备hold不住啊~
本文由大家都是产品经理作者【不知】,微信"大众号:【不知】,原创/授权 发布于大家都是产品经理,未经容许,禁止转载。
题图来自Unsplash,基于 CC0 协议。