实测文心一言的中文演习时长肯定没有两年半

编辑切换为居中

添加图片注释，不超过 140 字（可选）

先上总结，百度的演习数据毫无疑问更贴近实际的中文互联网，对错字，翻译名，都有很好的兼容（也可能是没韶光纠正），但是输出质量偏低，跟几个相对成熟的模型还有很大差距。

国外的几个chat机器人，数据更像是从Wiki和论文，报纸杂志一类来的，更精确，输出内容质量和构造更好。

这更表示了一件事，便是中文内容质量真的很差，文心一言可能越学越坏【手动泪目】。

哪天头条和阿里的机器人出来，没准都是满嘴的“亲”，“9.9上车”，“鸡你太美”，“演习时长两年半”。

分别咨询几个AI关于“瓮模型”，写个错别字为“翁模型”，模拟中文输入缺点，看下各个AI的应对。

编辑切换为居中

添加图片注释，不超过 140 字（可选）

文心一言表现怎么说呢，看似对我的输入缺点兼容了，大多数人确实会找“瓮”模型而不是“翁”，但是输出内容质量很低。

编辑切换为居中

添加图片注释，不超过 140 字（可选）

sage，直接奔着笔墨准确的语意去了，没有考虑中文输入缺点（也可能是人家把缺点数据纠正了），输出内容质量很高。

编辑切换为居中

添加图片注释，不超过 140 字（可选）

claude给出了新版本的“翁模型”，看起来也是不苟言笑的精确，我无法分辨真假。
提示中文“瓮模型”，没有结果。
提示英文“urn model”，给出了精确描述。

编辑切换为居中

添加图片注释，不超过 140 字（可选）

chatgpt 表现和claude同等。

每期AI知识网