文 | 学术头条

近年来,人工智能(AI)依赖深度学习、打算机视觉、自然措辞处理等技能打破与落地运用,不断颠覆着人类的既有认知——AlphaGo 通过自我强化学习击败了人类的顶尖围棋选手;而近日 Alphafold 更是破解了一项过去 50 年生物学领域的重大寻衅——蛋白质分子折叠问题。

自 1956 年 AI 的观点首次被提出后,AI 至今已有 60 多年的发展史。
如今,随着干系理论和技能的不断改造,AI 在数据、算力和算法“三要素”的支撑下越来越多地走进我们的日常生活,比如我们常见的语音识别、人脸识别和机器翻译等,都已经在手机、电脑等智能设备上有所运用。

但是,这一系列惊喜的背后,却是大多数 AI 在措辞理解、视觉场景理解、决策剖析等方面的举步维艰:这些技能依然紧张集中在感知层面,即用 AI 仿照人类的听觉、视觉等感知能力,却无法办理推理、方案、遐想、创作等繁芜的认知智能化任务。
当前的 AI 短缺信息进入“大脑”后的加工、理解和思考等,做的只是相对大略的比对和识别,仅仅勾留在“感知”阶段,而非“认知”,以感知智能技能为主的 AI 还与人类智能相差甚远。

科学盘点认知图谱全球第三代AI的大年夜机遇

究其缘故原由在于,AI 正面临着制约其向前发展的瓶颈问题:大规模知识知识库与基于认知的逻辑推理。
而基于知识图谱、认知推理、逻辑表达的认知图谱,则被越来越多的国内外学者和家当领袖认为是“目前可以打破这一技能瓶颈的可行办理方案之一”。

目前,人工智能的发展经历了从表示、打算到感知两个阶段,下一个阶段的核心是认知。
早在 2016 年,中国科学院院士、清华大学人工智能研究院院长张钹就提出了第三代 AI 体系的雏形,并于 2018 年底正式公开第三代 AI 的理论框架体系,其核心思想为:建立可阐明、鲁棒性的 AI 理论和方法;发展安全、可靠、可信及可扩展的 AI 技能;推动 AI 创新运用。

2019 年,图灵奖得主约书亚·本吉奥(Yoshua Bengio)在 NeurIPS 大会上也指出,深度学习该当以感知为主向,向基于认知的逻辑推理和知识表达的方向发展,这个思想和张钹院士提出的第三代 AI 的思路不谋而合。

图 | AI 的发展阶段

如今,第三代 AI 的理念在国内外得到广泛影响力。
业内普遍认为,认知智能将是进一步开释人工智能产能的关键,而认知图谱是实现认知智能技能打破的关键,不仅可以让机器理解数据实质,还可以让机器阐明征象实质。

认知图谱:实现认知智能的关键

机器认知智能的发展过程实质上是人类脑力不断解放的过程,是人工智能的最高阶段。
但是,让机器具备认知智能,其核心便是让机器具备理解和解释能力。
这种能力的实现与大规模、构造化的背景知识是密不可分的。

只管目前的智能系统在感知方面已经达到乃至超越人类水平,但在鲁棒性、可阐明性、安全可靠等方面还存在很多不敷。
比如,模型鲁棒性差,难以与准确性共生;模型可阐明性差,对付可靠性哀求高的任务很难胜任;缺少积累知识的能力,也没能和人类已有的知识体系进行很好的关联,缺少可靠的推理方法。

认知图谱旨在结合认知心理学、脑科学和人类知识等,研发领悟知识图谱、认知推理、逻辑表达的新一代认知引擎,支持大规模知识的表示、获取、推理与打算的根本理论和方法,实现人工智能从感知智能向认知智能的演进,建立可阐明、鲁棒性的认知智能

作为一种实现机器认知智能的底层支撑手段,认知图谱在电商平台、聪慧城市、法律行业、金融行业、安防行业、大数据的精准与风雅剖析、聪慧搜索、智能推举、智能阐明、自然人机交互等方面具有极为主要的浸染。

认知图谱的进程发展可以追溯到语义网络(Semantic Network)。
1968 年,M. Ross Quillian 在研究人类长期影象模型时,描述了人类长期影象的一样平常构造模型,认为影象由观点之间的联系来实现,并存储在繁芜的网络中,并基于此提出了语义网络的观点。

同年,专家系统之父、图灵奖得主爱德华·费根鲍姆(Edward Feigenbaum)等人研发出了天下首个专家系统 DENDRAL。
专家系统是早期 AI 的一个主要分支,它可以看作是一类具有专门知识和履历的打算机警能程序系统,一样平常采取 AI 中的知识表示和知识推理技能来仿照常日由领域专家才能办理的繁芜问题。

1998 年,万维网之父、ACM 图灵奖得到者蒂姆·伯纳斯-李(Tim Berners-Lee)爵士也提出了语义网的观点,其核心理念是通过给万维网上的文档(如:HTML 文档、XML 文档)添加能被打算机理解的语义“元数据”(Meta Data),使全体互联网成为一个通用的信息交流媒介,即用知识表示互联网,建立知识知识库。

2006 年,蒂姆·伯纳斯-李提出链接数据(Linked Data)的观点,表示数据不仅仅发布于语义网中,还要建立起数据之间的链接,从而形成一张巨大的链接数据网,其目的是构建一张打算性能理解的语义数据网络,而不仅仅是人能读懂的文档网络,从而在此之上构建更智能的运用。

2012 年,Google 的阿米特·辛格尔(Amit Singhal)等人先容了知识图谱(Knowledge Graph)的观点。
知识图谱以语义网络的构造化办法描述客不雅观天下中观点、实体、事宜以及它们之间的关系,相对付传统的本体和语义网络而言,实体覆盖率更高,语义关系也更加繁芜而全面。

图 | 认知图谱的蜕变进程(来源:报告《人工智能之认知图谱》)

但是,要让机器具备认知智能,其核心便是让机器具备理解和解释能力,这种能力的实现与大规模、构造化的背景知识是密不可分的。
2020 年,清华大学打算机系教授、系副主任唐杰在“人工智能下一个十年”报告中,结合认知科学和打算机理论,提出了一个实现认知智能的可行思路,即“认知图谱 = 知识图谱 + 认知推理 + 逻辑表达”,并希望利用知识表示、推理和决策,以及人的认知来办理繁芜问题。

这个思路的基本思想是结合认知科学中的双通道理论:人脑的认知系统中存在两个别系,即 System 1 和 System 2。
System 1 是一个直觉系统,它可以通过人对干系信息的直觉匹配探求答案,非常快速、大略;而 System 2 是一个剖析系统,它通过一定的推理、逻辑找到答案。

比如,回答一个详细问题:2003 年在洛杉矶 Quality 咖啡馆拍过电影的导演是谁?

要回答这一问题,首先须要 System 1 找到干系的影片,然后 System 2 做出决策,如果是标准答案,就结束全体推理过程;如果不是,而相应的信息又有用,就把它作为一个有用信息供应给 System 1,System 1 连续做知识扩展,System 2 则再次做出决策,直到找到终极答案。

由此可见,认知图谱的核心因此实现领悟知识驱动和数据驱动相结合的知识表示和推理的认知引擎为目标,研究支持鲁棒可阐明人工智能的大规模知识的表示、获取、推理与打算的根本理论和方法;培植包含措辞知识、知识知识、天下知识、认知知识的大规模知识图谱以及范例行业知识库,建成知识打算做事平台。

机遇与寻衅并存

近年来,虽然 AI 已经取得了快速发展,但如何将深度学习与大规模知识知识结合起来,实现认知推理与逻辑表达,还面临着很大寻衅。

研发领悟知识知识图谱、认知推理和逻辑表达等核心技能的认知图谱将成为实现下一代 AI 技能打破的关键,实现以认知图谱作为底层数据支撑,具有推理、具有可阐明性、具有认知的新一代 AI,是 AI 领域下一个 10 年主要的发展方向,也是一个机遇与寻衅并存的发展方向。

众所周知,技能的打破与发展离不开来自人才的持续创新,科技竞争归根结底也是人才的竞争。
那么,放眼中国乃至全天下,认知图谱领域的人才在哪里?

近日,清华大学人工智能研究院、北京智源人工智能研究院、清华-中国工程院知识智能联合研究中央、阿里集团-新零售智能引擎奇迹群联合发布了《人工智能之认知图谱》(Research Report of Cognitive Graph)报告。
该报告依托 AMiner 平台,对技能领先的国家、机构和学者,以及认知图谱干系领域的技能发展趋势、技能创新热点等进行了详细剖析。

数据显示,环球范围内认知图谱干系领域的学者紧张集中在北美、欧洲和亚洲。
美国的高水平学者数量在环球位居首位,其次是中国,第三是英国。

图 | 环球认知图谱干系领域学者分布舆图(来源:报告《人工智能之认知图谱》)

个中,中美两国的高水平学者数量远高于其他国家,在认知图谱干系领域具有较强的发展潜力。
中国虽然仅次于美国,但是高水平学者数量约是美国的一半,相差较大。

图 | h-index TOP 5000 环球学者的国家统计前 10 名

而海内认知图谱干系领域学者紧张分布在中国的经济和政治发达地区,包括京津冀、长江三角洲、珠江三角洲、喷鼻香港、台湾等地区,中部、西部和东北地区的学者则相对较少。

图 | 中国认知图谱干系领域学者分布舆图(来源:报告《人工智能之认知图谱》)

详细而言,北京、上海和江苏的认知图谱干系领域学者数排名前三位,分别为 129、45 和 36。
(参考 h-index 作为筛选条件,选择 TOP 5000 环球学者以舆图形式展示和剖析学者的地区分布,个中颜色越红、圆圈越大,表示人才越集中。

图 | h-index TOP 5000 中国学者的省市统计前 10 名

而且,美国在认知图谱干系领域的论文揭橥量和总被引频次、高水平学者数量均位居天下前列。
中国虽然在论文揭橥量和高水平学者数量方面仅次于美国,但与美国差距较大,并且论文总被引频次要低于英国和德国,在环球排名第四。

图 | 论文总被引频次排名前 10 的国家

此外,报告还基于 AMiner 平台将学者流入和流出数量之和作为筛选条件,统计了认知图谱干系领域的环球学者在 2009-2020 年间的流动数量排名前 10 的国家。

数据显示,美国、加拿大、法国的学者流入数量大于流出数量,而中国、英国、德国、意大利、印度、日本、西班牙的学者流出数量大于流入数量。

图 | 环球认知图谱领域学者的流动情形(来源:报告《人工智能之认知图谱》)

由此看出,中国近 10 年来的学者流动较为频繁,这与中国制订的出国培养、人才引进等干系人才政策不无关系。
随着经济环球化深入发展,科技人才的跨国流动更加频繁,各国对科技人才的争夺更加激烈。

那么,海内认知图谱干系领域的学者分布情形又如何呢?数据显示,北京是学者流入和流出数量都很高的城市,比其他城市赶过较多,这可能与北京的高校和科研院所数量较多有一定关系。
此外,北京、喷鼻香港、上海、哈尔滨的学者流出数量高于流入数量,而武汉、南京、西安、杭州、广州、合肥的学者流入数量高于流出数量。
北京、喷鼻香港、上海的学者流失落与这三个城市的高校数量较多、供求关系不平衡、人才竞争力和生活压力较大不无关联,而哈尔滨的地域环境造成了一定的学者流失落。
针对学者净流入数量为正值的这几个城市,通过调研干系资料,可以创造这些地方在积极实行人才引进政策,包括落户、房补、薪酬等方面均制订了相应的优惠方法。

图 | 中国认知图谱领域学者的流动情形(来源:报告《人工智能之认知图谱》)

以上剖析表明,不才一代 AI 的机遇与寻衅下,中国干系部门须要重视并采纳干系方法,让中国学者在重视论文数量的同时,也要提升论文质量,同时也要加快高水平科技人才军队的培植,一方面针对国际新场合排场从政策、资金、资源等多个方面加快本土培养,另一方面加大力度引进国外主要机构的精彩学者,改进人才构造,加速认知图谱领域的技能发展。

未来 10 年,具有推理、具有可阐明性、具有认知的新一代 AI,是 AI 领域的下一个主要发展方向,而研发领悟知识知识图谱、认知推理和逻辑表达等核心技能的认知图谱将成为实现下一代 AI 技能打破的关键,但归根结底还要依赖干系人才基于不懈努力做出的创新。