楔形笔墨是人类最古老的笔墨之一,揭开它的神秘面纱,一贯是研究职员孜孜以求的目标。如今,人工智能正在帮助破译美索不达米亚人刻写在陶泥板上的楔形笔墨,这些古老的泥板文书将为我们揭开人类历史早期一些不可思议的故事。
保存在大英博物馆中的楔形笔墨泥碑。(图/New Scientist)
英国伦敦大英博物馆,一扇紧闭的大门后面,是一座竹苞松茂的收藏阁,高高的拱形天花板彰显著它的高大富丽。在这个阔别尘世鼓噪的宁静房间里,欧文·芬克尔打开一个抽屉,取出一块陶泥制成的泥碑,上面已有了裂纹,还留有灼烧过的痕迹。它不是一块平常的泥碑——上面以天下上最古老的书写笔墨楔形笔墨记载了古人对未来的预言。
芬克尔是大英博物馆古代美索不达米亚措辞文化文献的助理保管员,也是天下上仅有几位能够流利阅读这种久已失落传的笔墨的人之一。他打开另一个抽屉,取出另一块泥碑,上面刻写的是巴比伦人对马尔杜克神的祈祷文。巴比伦是美索不达米亚地区的一座古城,后成为巴比伦帝国的中央,马尔杜克是古代巴比伦人信奉的主神,巴比伦的守护神。
芬克尔的身后,一位拍照师正对着泥碑上凹陷的蚀刻笔墨精心拍摄。他们的事情正在揭开一场破译古代笔墨伟大变革的序幕。这场革命将利用当今人工智能强大无匹的打算能力,唤醒沉睡5000年的古代人类历史,揭开天下第一文明埋藏已久的秘密。
只管早在165年前,就已有人破译了这种古代笔墨的符号,但大多数楔形笔墨符号文献资料从未被翻译成当代措辞。由于这是一项非常繁芜的事情,仅依赖芬克尔等少数精通楔形笔墨的专家来完成,显然是一项难以完成的弘大工程。
如今,随着人工智能的发展,打算机算法正在接管阅读和翻译楔形笔墨的演习,将大量泥碑留下的支离破碎的内容重新组合,并预测个中缺失落的部分,为理解古代美索不达米亚人的历史供应一幅完全的图景,同时也为追溯圣经故事的起源、探索人类早期文明的历史打开一扇新的窗口。
楔形笔墨的起源与演化
楔形笔墨的故事可追溯到6000年前的美索不达米亚地区,那里是位于底格里斯河和幼发拉底河之间的一片肥沃地区,位于如今的伊拉克境内。这一期间的人类社会正在经历重大变革,从小规模的农业聚居地逐渐发展成弘大的城市中央。苏美尔人在这里建立了最早一批城邦,乌鲁克城是个中最具代表性意义的主要城邦之一,城中寺庙林立,沟系纵横,到公元前3000年时,城中人口已达5万。城市成为周边地区的行政管理中枢,管理繁芜劳务系统的官僚系统编制也开始形成。
苏美尔语完备不同于如今我们所知晓的任何措辞,并且早已消散在历史的长河中。但苏美尔人留下的大量楔形笔墨泥板文书,让我们能有机会对当时美苏尔人的社会生活一探究竟。美索不达米亚地区是楔形笔墨的发源地,当时的人们将芦苇的末端压入尚未变硬的湿软陶泥板上,写下一个个被称为楔形笔墨的古老符号。
用芦苇笔在泥板上书写苏美尔楔形笔墨。(图/视觉中国)
虽然人们常日将楔形笔墨形成的文化遗产与诗歌和文学遐想在一起,但最早的楔形笔墨的利用完备是出于行政管理的须要,比如作为奴隶转让交割手续的凭据,或吸收畜生的签收收条等。最范例的一个例子是保存在大英博物馆内的一块刻写了啤酒配额记录的泥板文书,画一个瓶子代表一瓶啤酒,在人头上画圈代表数量,这是最初的象形符号笔墨,后来逐渐演化发展为更为抽象的笔墨形式。
楔形笔墨从大略的记事工具演化为一种措辞表达形式,经历了相称漫长的期间。最早的王室铭文涌现于公元前2700年旁边,最早的文学文本涌现于更晚的一百多年后。最早的文学作品作者是生活在4300年前的一位公主、女祭司和墨客恩赫杜安娜。她写下了许多赞颂诗和神话故事,个中最有名的是吉尔伽美什史诗,关于一位国王追求永生的故事。
美索不达米亚古代文明的影响一贯延伸并渗透到当代人类的生活中,圣经中的一些故事与苏美尔人的文化传统甚有渊源,苏美尔人还是如今仍用于钟表中的六十进制计数系统的发明者。
破译楔形笔墨困难重重
楔形笔墨本身并不是一种措辞,而是一种书写符号系统,好比英语中用的字母,同样也用于法文和德文中一样。苏美尔人从天下上消逝之后,他们的楔形笔墨书写办法流传了下来,成为许多其他措辞的书写符号,如阿卡德语、赫梯语、古埃尔西亚语等。在利用了3000年之后,这些书写符号与措辞,以及描述了历代王国兴衰的记录,一起消逝在了历史的长河中。
我们如今能够理解这段迢遥的历史,要归功于用来书写楔形笔墨的陶泥板。这是当时的一种廉价材料,随处可见,并且可以耐久保存。“非常幸运的是,除非被扔进河里,或被完备碾碎,这种上面写有笔墨的泥碑都能得以保存下来。”芬克尔说。
天下各地创造的泥碑数量已有成千上万,是我们探索早期人类文明的宝贵文化遗产,个中包括地球上最早帝国的编年史,苏美尔人创作的赞颂诗、来往信件、购物清单,乃至还有客户的投诉信。“有人说,人类历史的前半部都记录在了这些楔形笔墨泥碑上。”德国慕尼黑大学的恩里克·杰梅内兹说道。
这些泥碑中隐蔽着的远古时期的秘密不断被破译。2017年,学者创造,一块被称为“普林顿322”的3700年前的泥板文书是天下上最早涌现的三角学知识。它因曾被一名叫普林顿的人收藏而得名,“322”是普林顿的收藏编号,但其最初来源不详。碑文显示,生活在美索不达米亚中部和南部讲阿卡德语的巴比伦人,是最早研究三角学的人。
2021年,对1894年在伊拉克出土的一块泥碑的新的剖析研究创造,早在毕达哥拉斯(古希腊哲学家、数学家)出生几个世纪之前,巴比伦人就已开始对三角学进行打算和研究。遗憾的是,如今天下上只有75个人能够流利阅读楔形笔墨,大多数泥板文书只能束之高阁,在博物馆里悄悄蒙尘,鲜为人知。
古亚述楔形笔墨 图/视觉中国
楔形笔墨太繁芜,太难读懂,长期以来一贯困扰着人们。“碑文中笔墨的含义每每模棱两可,而一个词语可能会有不止一种书写办法。”杰梅内兹说。还有一个难题是,很多楔形笔墨泥碑并不完全,不是分裂缺角,便是碎成多个小块,常日边缘部分还有磨损,导致一段记事不是没有开头,便是没有结尾,或是中间部分缺失落。
亚述帝国国王阿什巴尼帕尔的藏书室是天下上现存最古老的皇家图书馆,收藏了来自美索不达米亚各地的大量书写文献,3万块泥碑记载了各种文献资料,包括宗教仪式、医学百科全书、天文不雅观测,以及王室开拓边陲的功绩等。
可惜的是,公元前612年,在城市被攻陷洗劫中,这座古老的皇家图书馆被焚为废墟。大英博物馆保存的大火中幸存下来的一些残碑上面,焦黑的灼烧痕迹仍旧历历在目。
要想还原历史,就要将这些碎片像做拼图游戏一样拼合起来,没有任何参考依据,难度很大。而且记载有楔形笔墨的泥碑分散在世界各处,网络起来也很困难。例如,吉尔伽美什史诗的开头部分保存在一块很小的陶泥碑文书残片上,光是找到并确认这块泥碑,就花了一百多年韶光。如今,有了人工智能来帮助做这项事情,统统都将有所不同。
AI演习“复原”巴比伦文学
“残片数据库”是杰梅内兹于2018年设立的“电子巴比伦文学项目”的一部分。该项目利用人工智能找出哪些残片同属于某一块泥碑,然后将它们重新组合起来,以还原阿什巴尼帕尔的皇家图书馆残余的泥版文书和其他泥碑的内容。杰梅内兹正在用开拓出来的算法对楔形笔墨的不同变体,以及多种副本之间的眇小差别进行比较研究。
经由演习的人工智能可以对碑文进行翻译。研究职员根据文本符号的音译,对人工智能进行深度学习演习。楔形笔墨符号的发音依据的是拉丁字母的发音办法,就像汉字的普通话发音用的是拼音一样。经由学习演习的人工智能可以预测哪些楔形符号可能涌如今缺失落的残片中,还可以在数字化的弘大残片数据库中搜索特定的楔形笔墨符号。
2019年,人工智能帮助在多个残片中找到了吉尔伽美什史诗中的缺失落部分,还创造了一种新的古代文学文体,其特点是风趣、夸年夜和模拟,比如一堆会开玩笑的驴粪,紧张是用来帮助小学生学习读写技能的。
杰梅内兹与伊拉克巴格达大学伊尔克分校的安玛·法迪尔一起,通过人工智能的帮助,创造了另一种以前不为人知的文学文体——城市赞颂诗。比如,巴比伦城赞颂诗对寺庙僧侣的日常进行了细致的描述。
2021年,在世界上首次利用人工智能完备自主识别楔形笔墨片段的过程中,研究职员创造了名诗《正义的受难者》中缺失落的片段。
其他一些研究职员关注的重点是反响普通行政事情的楔形笔墨文本。研究创造,大量内容短小的收据文本出自不同的机构,如寺庙或当地统治者的官邸,或是个人(如贩子)之间进行交易的书面文本。这些丰富的信息是美索不达米亚古老文明的主要组成部分之一。
苏美尔泥碑文本中常日包含个人姓名和日期,根据这些线索,可以追溯理解某人在当时社会中承担的角色。例如,形成于公元前2300年旁边,被称为“Mama-ummi档案”的80块泥碑文本描述了一位名叫Mama ummi的女主管,她卖力一个由180名织工组成的团队。这份资料表明,当时的女性有很多的事情机会,这一点非常出人意料。
面对浩如烟海的楔形笔墨行政信息,加拿大多伦多大学的希瑟·贝克于2017年建立了完美的楔形笔墨机器翻译和自动剖析系统。在不久前的测试中,他们先用45500个音译短语对不同的人工智能算法进行演习,每个短语由多达19个单词组成,然后对人工智能将苏美尔语单词翻译成英语的能力进行了测试。2021年公布的结果表明,某种特定人工智能算法的翻译准确性可达95%。该系统还能从文本中提取关键词信息,对职员、地点和神祗等种别进行识别。
2021年,以色列耶路撒冷希伯来大学打算机科学家加布里埃尔·斯坦诺夫斯基和他的同事还找到了一种预测残片缺失落笔墨的方法,类似于在手机上输入笔墨时的自动预测。
研究职员考试测验给深度学习人工智能馈入上万块阿卡德语书写的楔形笔墨泥碑的音译单词信息,创造人工智能根据高下文补充缺失落部分内容的准确率能达到80%。
人工智能的另一项潜在运用是确定泥版文书的年代,即以已知年代为线索,演习人工智能算法预测其他文件中缺失落年代信息的能力。
但是,从符号音译来解读楔形笔墨是一回事,要解读楔形笔墨本身又是另一回事。楔形笔墨不仅随着韶光的推移在演化,其拼写也在变革,不同期间的楔形笔墨还被用于不同的措辞。最棘手的是,符号之间没有间隙,要推断出哪组楔形符号构成某个单词非常困难。拉丁字母包含26个字母,但楔形书写符号多达900多个,而且它们看起来非常相似。
为战胜这重重困难,研究职员正在开拓类似于文本识别的人工智能打算机系统,向破译楔形笔墨的目标迈进。研究职员演习了一种叫做“Deepscribe”的机器学习系统,用来解读波斯波利斯卫城档案的数千块楔形笔墨文本,这是在大约公元前500年前修建的一道防御工事墙中创造的埃兰语行政管理文书。研究团队成员、美国芝加哥大学的苏珊娜·保卢斯指出,“打算机能够识别单词的起始符号和闭幕符号的边界,然后用方框围住,这是一项巨大的造诣。对付那些没有分隔的持续串符号,人们常日没有办法知道一个单词的起始位置和闭幕位置。”
未来有望实现AI即时翻译
在人工智能的帮助下,未来将有望实现将符号识别系统和当代措辞翻译系统一体化的目标。这将意味着大概有一天,我们就可以用手机拍下博物馆里一块泥碑文书的照片,并即时读出上面的内容。
要实现这一伟大目标,须要一个弘大的数字化文本数据库来支持人工智能算法的演习和学习。目前天下各大博物馆中约50万件楔形笔墨文本中,只有一半经由了音译翻译或文本翻译,经数字化处理的文本只有大约10万件。“楔形笔墨数字图书馆操持”和“电子巴比伦文学项目”的进展正在改变目前这一现状。
以色列阿里尔大学的萨伊·戈尔丁表示:“楔形笔墨文本数字化可为学者带来大量新信息和新联系。一旦能够将这些信息放在一个弘大的联通网络中,下一个重大打破的契机就会到来。我们就可以对那个时期古人的生活有一个全面的理解。”
人工智能对楔形笔墨泥碑进行扫描翻译示意图。(图/New Scientist)
开始阶段须要大量辛劳的事情,首先要得到各地博物馆和私人藏品中所有楔形笔墨泥碑文书的高清图像。目前,作为“电子巴比伦文学项目”的组成部分之一,大英博物馆收藏的阿什巴尼帕尔图书馆4万件楔形笔墨泥碑残片的拍摄事情正在进行之中。
在一间分外的拍摄事情室内,拍照师阿尔伯托·吉亚尼斯给每件楔形笔墨泥碑拍摄六张图像——正面、背面、顶部、底部和两个侧面。吉亚尼斯说,文本并不总在边缘处结束,有时乃至区分前后和高下都很难。
然后,打算机软件会将这六张图像的内容拼接组合起来,再由杰梅内兹这样的楔形笔墨专家进行辨认和翻译。据估量,2023年将完成所有楔形笔墨藏品的拍摄事情,并向大众公开。以往深藏于大英博物馆内的楔形笔墨藏品不是普通大众都有机会不雅观赏到的,但经由数字化处理的藏品,可以让人们舒畅地坐在自己家中,欣赏苏美尔阿什巴尼帕尔图书馆的泥碑文献和其他早已失落传的楔形笔墨文本。
回望历史,数千年前的人类给我们留下了卷帙浩繁的楔形笔墨文书,以及承载个中的文化思想;展望未来,这些独具远古文化特色的泥碑文本,在人工智能的强大打算能力下,重新组合和解码,以当代科技的数字化形式,重现古代人类文明曾经的辉煌。