在本章中,你将深入Al,并从不同的角度理解其意义,例如,从消费者、科学家或工程师的角度出发,理解它是如何影响你的生活。你也会创造Al并不等同于机器学习,虽然媒体常常将两者混为一谈。只管机器学习与Al是干系的,但它们是不同的。
1.1超越炒作
任何技能随着其变得越来越强大,干系的炒作也会尘器甚上,Al肯定也是如此。一方面,有些人开始渲染胆怯气氛,而不是宣扬科学。电影《闭幕者》里所描述的机器人杀手,实在没什么大不了的。你第一次亲自体验机器人Al的形式,更有可能是享受一名保健助理的做事(见文Why Robots Are the Future of Elder Care)或者是和它共事(见文Meet the virtual woman who may take yourjob )。现实是,你已经以一种非常平凡的办法在和A1及机器学习进行交互了。阅读本章的部分缘故原由是你须要看清炒作的背后, Al到底可以做些什么。
你也可能看到有人将机器学习和Al同等对待。A包括机器学习,但机器学习并不能完备定义Al,本章将帮助你理解机器学习和Al之间的关系,以便你能更好地理解本书,理解它是如何帮助你进入仅仅在科学小说中才会涌现的技能。
机器学习和A1都具有很强的工程元素。也便是说,你可以根据理论(经由实证和测试的阐明)精确地量化这两种技能,而不是仅仅依赖大略的假设(对某种征象的建议性阐明)。此外,两者都拥有强大的科学身分,人们通过科学来测试观点,并创造出新的思路,以创造思想过程有多强的表达力。末了,机器学习也须要艺术的细胞,这让才华横溢的科学家有了用武之地。在某些情形下, Al和机器学习与艺术看似室无逻辑,而只有真正的艺术家才能让它们按照我们所预期的那样进行事情。
1.2 梦到电子羊
Android (一种外不雅观和行为看起来像人类的分外机器人,例如《星际迷航》中的Data )和某些类型的人形机器人(一种具有人类特色但随意马虎与人类区分的机器人,例如《星球大战》中的C-3PO )已成为Al的海报代言人。它们通过拟人化的形式向我们展示了打算机系统。事实上,这是完备有可能的,有一天你将无法轻松地区分人类和人造人。科幻小说的作者,如菲利普·迪克( Philip K.Dick) ,很早之前就预言了这点,现在看来也很有可能成为现实。"Android是否会梦见电子羊”的故事谈论了全体观点,而这个观点也越来越真实。这个想法涌如今电影《银翼杀手》的剧情中。以下内容可以帮助你理解目前的科学技能与科幻小说及电影所提出的理念到底有多靠近。
当前的艺术品可谓是维妙维肖,但你可以轻松地辨别自己是否正在和一位Android进行通话。你不雅观看在线的视频,就能理解与人类无法区分的机器人至今尚不存在。个中一个更逼真的例子是Amelia。她的故事被ComputerWorld宣布宣布。关键是,这些技能才刚刚开始,大概终极人们能够创造逼真的机器人和Android但是本日它们还不存在。
1.2.1 理解AI和机器学习的历史
人类将终极的Al看作包含在某类Android中的产物,除了拟人化之外,还有一个缘故原由。自从古希腊人以来,人类就开始谈论将意志置于机器体内的可能性。干系的一个神话便是一位名叫Talos的机器人(详见Ancient Wisdom网站中的Greek Automata )。实际上古希腊人拥有很多繁芜的机器设备,虽然只有一个保存至今,但很可能他们的梦想不仅仅是建立在抱负之上。几个世纪以来,人们已经谈论了能够思考的机器人物(例如Rabbi Judah Loew的石头人Golem)。
A1建立在这个假设之上:思想机器化是可能的。在公元后的1000年间,希腊、印度和中国的哲学家都在思考如何实现。最早在17世纪,戈特弗里德·莱布尼兹( Gottfried Leibniz)、托马斯·霍布斯(Thomas Hobbes )和雷内·笛卡尔( René Descartes )就谈论了将所有思想转化为大略数学符号的可能性。当然,这个问题的繁芜性让他们百思不得其解(只管你在本书第三部分将读到目前所取得的进展,但至今它仍旧让我门困惑不已)。关键是AIl的愿景已经存在了很永劫光,但Al的实现却只是最近才刚刚开始。
如今我们所知道的Al实际上出身于1950年阿兰·图灵( Alan Turing )出版的《打算机与智能》。在这篇文章中,图灵探索了如何确定机器是否能够思考的想法。当然,这篇文章引入了3个角色的仿照游戏。角色A是一台打算机,角色B是一个真实的人。这两位角色都必须说服角色C(一个看不到角色A和角色B的真人),自己是人类。如果角色C无法准确地分辨谁是人、谁是机器,那么就剖断打算机得胜。
Al领域一贯存在过于乐不雅观的问题。科学家试图用Al办理的问题是非常繁芜的。然而,二十世纪五六十年代的乐不雅观主义使科学家书任,天下将在短短20年内生产出智能机器。无论如何,机器确实正在做各种令人惊异的事情,比如参与繁芜的游戏。目前AI在物流、数据挖掘和医疗诊断等领域取得了巨大的成功。
1.2.2 机器学习能为Al做什么
机器学习依赖算法来剖析巨大的数据集。目前,机器学习还不能供应电影所描述的那种Al,纵然是最好的算法也不能思考、觉得、呈现出任何形式的自我意识,或者利用自由意志。机器学习所能做的因此远远超过任何人类的速率实行预测剖析。因此,机器学习可以帮助人们更有效地事情。以是, Al的现状是它只作为实行剖析的类型之一,而人类仍旧须要考虑到这一剖析的影响-做出必要的道德和伦理上的决定。1.4节将深入研究机器学习对全体Al的贡献。这个问题的实质在于机器学习只是Al的学习部分,而且它尚无能力创造你在电影中所看到的那种Al。
学习和智力让人困惑的地方紧张在于:人们认为只要机器将事情干得更好(学习) ,那么它也就具有了意识(智力)。这种机器学习的不雅观点还没有得到任何证据的支持。当人们认为打算机在故意给他们制造麻烦时,会产生同样的征象。打算机没有感情,因此只能利用包含在运用程序中的指令,对所供应的输入进行处理。当打算机能够精确地仿照这些大自然中奥妙的事物时,才会拥有真正的Al。
遗传学:从这一代到下一代的缓慢学习。
传授教化:根据有组织的资源所进行的快速学习。
探索:通过媒体与他人的互动所进行的自发学习。
1.2.3机器学习的目标
目前,Al是基于机器学习的,而机器学习从实质上来说和统计学有所差异。确实,机器学习以统计学为根本,但是由于目标不一样,以是它与统计学有一些不同的假设。表1-1列出了比较机器学习和统计学的时候,须要考虑的一些特色。
表1—1比较机器学习和统计学
1.2.4硬件决定了机器学习的极限
巨大的数据集须要大量的内存。不幸的是,需求还不仅仅是这些。当你拥有海量的数据和内存时,你还必须拥有多个内核和高速的处理器。如何更有效地利用现有的硬件,是科学家正在努力办理的问题之一。在某些情形下,等待几天才能得到机器学习的结果是无法接管的。纵然结果并不是那么精确,科学家仍旧想快速地知晓答案。请记住这一点:投资更好的硬件意味着投资更好的科学。本书涵盖了以下一些问题,来提升你的机器学习体验。
得到有用的结果:在阅读本书之时,你会创造须要先得到初步有效的结果,然后再进行优化。其余,有的时候如果算法调度得太过头,结果将变得相称不可靠(离开特定的数据集可能就没有用了)。
提出精确的问题:在通过机器学习得到答案的过程中,许多人感到沮丧,其缘故原由是他们只顾闷头调算法,而没有考试测验提出新的问题。为了有效地利用硬件,有时你须要往回退一步,重新核阅自己提出的问题。问题本身可能是缺点的,这意味着纵然是最好的硬件也无法帮助你办理问题。
过多地依赖直觉:所有的机器学习问题都是从某个假设开始。科学家利用直觉创造一个出发点,继而创造问题的答案。在机器学习的体验中,失落败比成功更常见。直觉增加了机器学习体验中的艺术身分,但有时直觉是缺点的,你必须重新考虑自己的假设。
当你开始意识到环境对机器学习的主要性时,你也开始理解为什么须要得当的硬件、适当的权衡来得到所需的结果。实际上,目前最新的系统依赖于图形处理单元(GPU )来实行机器学习任务。GPU的利用大大地加快了机器学习的过程。关于GPU的详细磋商超出了本书的内容范围,但你可以在Nvidia Developer的博客中阅读有关该主题的更多信息。
本文节选自《机器学习入门与实战》
本书是“达人迷”经典系列中关于机器学习的一本。本书内容分为6 个部分,共计 23 章,由浅入深地讲解机器学习的根本知识,本书利用的措辞——Python和R,必备数学知识,处理数据的常用工具,机器学习的运用以及常见的学习包、模型等6个方面,以帮助读者理解并节制机器学习的干系知识、并能将其运用于自己的事情中。