AI 不过是统计学Thomas J. Sargent :人工智能只是统计学的延伸

2011年诺贝尔经济学奖取得者Thomas J. Sargent在题为“共享环球聪慧 引领将来科技”的天下科技创新论坛上表示:

打算机是非常善于打算,它们可以非常快速地完成打算人算不了的东西,但终极必须由人来组织和剖析这些打算。
你可以看一些非常成功的人工智能运用,它不仅是机器在「思考」,也是科学家在思考。
像 AlphaGo 的算法看上去是第一次涌现,但实在有很多非常聪明的数学,并且是由人设置传授教化内容。
人工智能是由机器和人分饰两角的,非常有趣。

AI时代的中层支柱统计学

任正非:人工智能便是统计学

华为创始人兼CEO任正非在接管央视《面对面》采访,当谈到人工智能是,任正非表示:

中国没有人工智能这门课,打算机与统计学,审计学与审计学,你说我们要进入大数据时期,大数据时期做啥?统计。
解释我们国家在数学上重视不足,第二个在数学中的统计学重视不足。

金榕:统计学是人工智能多少主要根本之一,但远不是全部

阿里巴巴达摩院机器智能技能实验室主任金榕:

除了统计,AI中的“学习”“推理”和“决策”中还利用了代数、逻辑、最优化等许多其他学科知识与方法。
此外,有了算法后如何有效实现也非常主要。
以是,纯挚说AI便是统计学,或者说“所有的AI都是利用统计学来办理问题的”都是片面和不准确的。

关于AI与统计学的关系,只管众说纷纭,各位大佬持有不同见地,但是,我们仍旧不难创造统计学在AI发展中霸占非常主要的位置。

统计学VS人工智能发展史

为了剖析统计学和AI的关系,我们同时追溯他们的发展史,找出个中的交叉部分。

1. 统计学发展史

人类的统计实践是随着计数活动而产生的,统计发展史可以追溯到距今足有五千多年的原始社会,而使统计学开始成为一门系统的学科却是距今三百余年的事情。

从统计学三个大的发展阶段可以看出,统计学经历了实践→理论→考验三个期间,当前统计学紧张是通过对数据的描述与剖析来进行对未来的推断,这与AI的定义十分相似。

2. AI发展史

AI发展史可以追溯到打算机出身时期。

在经历过二十年黄金时期的发展后,人们开始意识到打算类的功能可以被机器很好的完成。
但是,对付感知类的功能却很难达到仿照人类的哀求。
人们对人工智能的理解也从抱负中的智能转变到重视人工技能。

Thomas J. Sargent :人工智能是由机器和人分饰两角的,非常有趣。

现在人们对付人工智能的期待,不再像科幻电影里那样不切实际。
技能职员意识到当下可以实现的AI技能是基于人的“思考”,让机器来履行,AI该当着眼于解放生产力而不是“完备更换人类”。

3. 统计学和AI的交叉点

1988年,美国科学家朱迪亚·皮尔将概率统计方法引入人工智能的推理过程中。

后来,IBM的沃森研究中央把概率统计方法引入到Candide项目——一个基于200多万条语句实现了英语和法语之间的自动翻译。

1992年,华人李开复利用统计学的方法设计开拓了Siri最早的原型。
从将统计学引入AI研究后,直至近期大家所熟知的阿尔法go,AI的侧重之一便是机器学习。
基于由人类产生的大量数据,利用人类思维去剖析标记,然后引入机器进行学习,终极让机器节制规则和规律进行事情。

我们不难创造:统计学和AI有了一个共同的研究工具——数据。

统计学观点在AI中的运用

统计学作为交叉学科之一推动着人工智能的发展,在发展中逐渐被运用于各行各业。
不论往后从事AI产品经理,还是AI工程师,只有具备良好的统计学根本才能对数据剖析具有准确、深入的理解。

1. 运用于调查数据

以机器学习为例:其核心是“利用算法解析数据,从中学习,然后对天下上的某件事情做出决定或预测”。

在学习之前就要进行数据剖析,而机器学习须要弘大的数据集作为支撑才能担保其学习效果。

对付婴儿来说,纵然只有三岁,也不雅观看过数亿张图像,拥有弘大的数据库。
要想让AI“靠谱”,就要有靠谱的数据。
统计学的数据获取方法与处理方法是机器学习建立数据集必需要利用的。

图片来自:https://www.jianshu.com/p/0fed5efab3e5

统计学上的数据来源:

统计学常见数据的处理:

2. 运用于建造模型

面对没有标准定义的数据:

比如:电商平台希望把数据中会恶意退货的那些人给找出来,但数据并未指明哪些人恶意退货。

对这个详细数据,没有教科书或文献给出任何的方法。
这就要有独特的处理方法,你必须考虑基于什么样的恶意退货机理和背景来建立模型,不能单一的就把有过几次退货操作的用户找出来,你就要理解用户退货方面的思维办法。

对付人类来讲,这种推断与判断的行为并没有繁芜的数学运算。
但对付机器来说,这统统都要基于数学运算。
有效的运算模型是AI推断的根本。

面对没有模型的统计需求:

比如:运营团队希望可以预测一个新营销活动可带来的流量有多少,这并不能大略靠一些公式、几个模型办理。

现有的模型一样平常比较固定,例子也大略,不符合繁芜的实际数据。
经典统计上确定模型的利害方法严重依赖于对数据的无法证明的浩瀚数学假定。
那么,如果想在浩瀚统计模型中要挑一个真正知足实际需求的,就须要把数据拿过来做交叉验证。
交叉验证,便是用一部分数据来建立一个模型,然后用其余一块数据来验证这个模型。
交叉验证是判断AI是否能做出有效预测的主要手段。

统计学是AI发展的根本之一

通过以上对付统计学在AI领域运用的简短剖析,我们不丢脸出统计学的确是AI不可短缺的一部分,但是仅有统计学并不能实现真正的AI。

Thomas J. Sargent与任正非对付统计学主要性切实其实定是精确的,金榕对付多技能支持的不雅观点也是精确的。
统计学作为传统的经典学科,支撑起了AI发展的根本。
但AI不应被定性为一门全新的技能,而应是已有技能的延伸与发展。
没有哪项新技能是凭空出身的,未来将传统学科运用于新领域是高档教诲的一个迁移转变点。

本篇文章仅是作者在学习统计学时的做的一些思考,希望能抛砖引玉。
随着大数据时期的来临,未来将有更多PM投身于数据剖析,设计出精良的数据剖析、预测工具。

#专栏作家#

无问西东,大家都是产品经理专栏作家。
工商管理硕士,猫奴一枚。
主导过金融公司台账系统、多公司OA系统;参与过二手车平台、P2P平台设计。

本文原创发布于大家都是产品经理。
未经容许,禁止转载

题图来自 Unsplash ,基于 CC0 协议