编辑切换为居中

添加图片注释,不超过 140 字(可选)

先上总结,百度的演习数据毫无疑问更贴近实际的中文互联网,对错字,翻译名,都有很好的兼容(也可能是没韶光纠正),但是输出质量偏低,跟几个相对成熟的模型还有很大差距。

国外的几个chat机器人,数据更像是从Wiki和论文,报纸杂志一类来的,更精确,输出内容质量和构造更好。

实测文心一言的中文演习时长肯定没有两年半

这更表示了一件事,便是中文内容质量真的很差,文心一言可能越学越坏【手动泪目】。

哪天头条和阿里的机器人出来,没准都是满嘴的“亲”,“9.9上车”,“鸡你太美”,“演习时长两年半”。

分别咨询几个AI关于“瓮模型”,写个错别字为“翁模型”,模拟中文输入缺点,看下各个AI的应对。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

文心一言表现怎么说呢,看似对我的输入缺点兼容了,大多数人确实会找“瓮”模型而不是“翁”,但是输出内容质量很低。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

sage,直接奔着笔墨准确的语意去了,没有考虑中文输入缺点(也可能是人家把缺点数据纠正了),输出内容质量很高。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

claude给出了新版本的“翁模型”,看起来也是不苟言笑的精确,我无法分辨真假。
提示中文“瓮模型”,没有结果。
提示英文“urn model”,给出了精确描述。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

chatgpt 表现和claude同等。