图 | 新翻译系统使 Facebook 每天能做 200 亿份翻译任务(来源:incamerastock / Alamy)
在学术机构用来自动评估机器翻译质量的 100 分制中,该人工智能的表现比同类翻译系统赶过 10 分。该模型的翻译也由人类进行了翻译评估,其准确率约为 90%。
Facebook 的研究职员在网上网络了 100 种措辞的 75 亿对句子,然后对翻译 AI 进行演习。当然,并非所有措辞的句子对数量都相同。Facebook 智能翻译项目卖力人安吉拉・范 (Angela Fan) 说:“环球有很多地区利用两种措辞,而且个中并不包括英语。我真正感兴趣的是,我们不须要再用英语作为‘中间人’。”
该翻译 AI 的演习方法关注的是那些常日须要相互切换的措辞,然后根据地理和文化相似性将措辞分为 14 个不同的凑集。这确保了对更常用的互换进行高质量的翻译,并更准确地演习模型。
对付一些措辞对来说,新翻译系统比现有的翻译质量有了显著提高。例如,将西班牙语翻译成葡萄牙语的难度特殊大,由于西班牙语是天下上利用人数第二多的官方措辞,这意味着研究职员可以得到大量的演习数据。英语和白俄罗斯语之间的翻译质量也比现有系统有所提高,由于白俄罗斯语和俄语有相似之处,AI 通过翻译俄语进行了演习。
目前该系统还没有在社交网站上利用,但 Facebook 操持很快将其投入利用。Facebook 希望借助它来处理人们每天利用 160 多种措辞撰写的帖子时产生的 200 亿份翻译任务。未来,Facebook 还将办理其他措辞上的翻译难题,Fan 说,“特殊是那些我们没有很多数据的措辞,比如东南亚和非洲的措辞。”
爱尔兰都柏林圣三一大学 ADAPT 中央的 Sheila Castilho 说,这项事情 “冲破了以英语为中央的翻译模式,并试图建立更多样化的多措辞翻译模式,让人线人一新。” 但 Castilho 表示,人类只评估稽核了一小部分翻译实例,这是否是对人工智能表现的准确判断尚未可知。
她还担心,这项评估是由双语志愿者完成的,而不是专业的翻译职员。她说:“非专业人士缺少翻译知识,因此可能不会把稳到一个翻译比另一个翻译更好的细微差别。”
她在 ADAPT 中央的同事 Andy Way 认为,Facebook 并没有和最前辈的翻译系统进行公正的比较。他说:“他们声称新系统比‘以英语为中央’的翻译模式有了很大的进步,这种说法有点空洞,由于大多数时候,人们已经不这么做了”。然而 Facebook 不同意这种说法,称通过英语翻译仍旧是普遍征象。