人工神经网络通过演习与预测的过程实现运用,对并行打算能力哀求高,演习偏好高性能,预测对大略指令重复打算和及时性哀求高。随着大数据存取、算力以及深度学习演习方法等方面的瓶颈被打破,芯片作为AI领域的上游成为了率先爆发的家当。
CPU 难以知足并行打算哀求,AI芯片站上舞台。
CPU的串行构造难以应对AI打算在大略指令下的并行算力哀求,AI芯片应运而生。个中,GPU因其易编程性和良好的并行打算能力最早最广泛被运用于AI打算。
AI芯片各有千秋,非冯架构下的非类脑芯片霸占上风,GPU仍是主流,FPGA和ASIC增速较快。
按照是否为冯诺依曼架构及是否为类脑芯片可对市场中用于AI打算的芯片进行分类:冯诺依曼架构下均是非类脑芯片,紧张包括传统的CPU和GPU;
非冯架构下包括类脑与非类脑芯片,个中非类脑芯片包含ASIC(寒武纪、谷歌TPU等)、FPGA和部分新GPU(Nvidia的Tesla系列等)。类脑芯片包括IBM的TrueNorth等。在紧张的AI芯片中:
GPU峰值性能高、通用性好,但功耗大,适用于数据中央和演习过程;FPGA效率高、灵巧性好,但峰值性能弱、本钱高,适用虚拟化云平台和预测过程;ASIC效率高、功耗比佳,但量产前本钱高,适用智能终端和AI平台;类脑芯片能耗低、感知力强,但缺少演习、精度低。英伟达新推Volta架构,GPU有望保持领导地位,Intel加码CPU+FPGA,而以寒武纪为代表的ASIC厂商在终真个落地前景更为广阔。
英伟达Volta架构提升了GPU预测效率,Intel不断推进CPU+FPGA架构,未来或呈现GPU发展高端繁芜算法、高性能打算和数据中央;ASIC发展智能终端、AI平台与算法IP化;FPGA运用于变革较快的行业运用和虚拟化云平台这样的格局,个中看重终端寒武纪等ASIC的落地前景更为广阔。
发达国家的ICT家当建立在强势的芯片根本之上。芯片家当是一国工业的支柱之一,其下贱的ICT家当在美、日、韩等发达国家中的地位尤为主要。我们耳熟能详的诸多公司,如美国的谷歌、IBM、Intel、微软、Apple、AT&T、英伟达,韩国的三星,日本的Sony、东芝等都属于ICT领域,每年能贡献超百亿美元的利润。这些公司或是自身的产品或是上游均是芯片行业,本国芯片家当的强势不仅让这些公司站稳了脚跟,对其海内子工智能、信息安全、网络培植等诸多领域的推动浸染更是不言而喻。
海思等企业逐渐崛起,中国“芯”也在不断追赶。近几年,只管环球芯片家当仍由Intel、高通、英伟达等巨子把持,我国芯片家当仍呈现出发达的发展力,近三年行业发卖额复合增长率超20%。2009年环球纯芯片设计公司50强中,中国第一家闯入天下50强的是华为旗下的海思公司,而2014年这个数目达到了9家,2016年增长到了11家,分别是海思、紫光展讯,紫光锐迪科、复兴、大唐、南瑞、华大、ISSI、瑞芯微、全志和澜起科技。
此外,虽然2016年环球前20大半导体公司中没有中国企业的身影,但是其门槛44.55亿美元与海思2016年的收入基本相称,而表中的不少公司营收增速非常缓慢,尤其是排名居后的4家增速基本在0%附近,明年海思有望进入环球前20强。
ASIC摆脱传统包袱打破桎梏。2016年6月,中星微发布海内首款嵌入式NPU(神经网络处理器)芯片,并运用于环球首款嵌入式视频处理芯片“星光智能一号”。同样在2016年,今年成为环球人工智能芯片领域唯一独角兽公司的“寒武纪”发布了“DIANNAO”系列的首个型号,至今已有三代,其背后的机理和指令集更是被同行广泛引用。公司也成为环球第一个成功流片并拥有成熟产品的AI芯片公司,而随着华为麒麟970装置上了其1A型号的芯片,寒武纪芯片在智能终真个商用已在迅速推进。这样的打破在海内传统的集成电路行业是弗成思议的。
ASIC芯片存在竞争空间,海内运用市场较大,有望以点及面助力AI芯片弯道超车。如果说在芯片家当上ARM对X86架构的反击制衡造诣于移动终真个兴起,那么AI浪潮之下,AI芯片尤其是专用于深度学弟的ASIC,用以点及面的办法实现超过式发展,未尝不是一个弯道超车的好机会。我们可以看到,竞争空间上,传统的CPU领域有Intel、高通,GPU领域有英伟达,FPGA中有Xilinx和Altera,唯有与人工智能打算最为定制化结合的ASIC领域尚未有绝对的垄断性龙头;运用处景上,ASIC适用于终端设备,而中国海内安防空间巨大,国产智好手机出货量也霸占了环球近半壁江山,新零售家当的发展也位居环球前列,潜在的市场十分巨大。
豪强纷纭脱手,智好手机、可穿着设备、安防前端等均可能成为ASIC芯片落地放量的先行地。AI芯片尤其是ASIC芯片由于其低功耗高效率的特点特殊适用于功耗较低,空间较小的智好手机、智能安防摄像头、智能家居、无人机等智能终端,这些领域可能成为ASIC芯片率先放量之处。
手机端对付及时性的高哀求让移动端AI芯片成为必需品,近期华为发布了搭载寒武纪芯片的麒麟970,苹果发布内置神经网络引擎的A11 Bionic,对移动端AI芯片家当起到推波助澜的浸染。智能技能在安防行业的运用也非常广泛,目前安防行业方向于利用前端智能摄像头与后端处理平台结合的办法提高剖析效率,如海康的摄像机就配备了Movidius开拓的视觉处理器和英伟达Jetson芯片。
国产化趋势或带来发展良机。国产化趋势下,安防、聪慧城市等由政府推动的敏感性行业的采购清单方向于国产商品,智能芯片作为底层核心硬件将会受到特殊关注。海内芯片家当已有多个企业跻身环球前50强,寒武纪、地平线机器人等企业的AI芯片研发能力环球领先,华为、紫光等企业在芯片行业的体量也十分巨大。随着海内上风企业的发展,以及国家对芯片自给率政策哀求的推动下,芯片逐步国产化将为海内企业带来发展良机。AI芯片作为实现人工智能领域的重中之重,其海内的市场前景十分广阔。
在此AI芯片站上风口之际,我们试图从算法和需求层面,由浅入深为各位梳理神经网络与深度学习的算法和运用发展对芯片的各方位哀求,并从AI芯片的优缺陷比拟、运用处景和未来路线角度,与各位一同探寻行业的业态和未来的发展。
大数据获取能力、算力和对多层次神经网络的演习方法的不敷,使得深度学习运用的繁荣延迟至今。实在人工智能以及深度学习的很多根本算法在20世纪60年代就已经比较成熟了,包括现在被广泛运用的反向传播算法(BP)在80年代就已经达到了算法的繁荣期,之以是在当初没有像现在这样站上风口,一方面源于当时算力不敷、用于演习的数据量不足以及演习方法的缺失落,另一方面也由于AI在当时有一定的运用,但急迫性和现在还无法比拟。
算力方面,纵然是2000年Intel推出的第一款Pentium 4 CPU芯片,也只是主频1.3-1.4GHZ的单核处理器,集成了4200万个晶体管,而现在很多CPU主频已经超过了4GHz,普遍为四核、八核,晶体管数量达到几十亿的水平,更不用说Nvidia最新发布的GPU系列,集成的晶体管数量已经超过200亿个。
演习方法方面,2006年,机器学习领域泰斗Geoffrey Hinton在《科学》上揭橥了一篇文章,开启了深度学习在学术界和工业界的浪潮。这篇文章提出,通过无监督学习实现“逐层初始化”来演习多层次的神经网络,可以战胜深度神经网络在演习上的困难。
数据方面,深度学习每每一项演习任务就须要数亿级别的样本,以往数据网络终端和场景缺失落,短缺易于处理的构造化数据,使得数据样本非常稀缺,达不到有效的演习目的,而现在智好手机、可穿着设备、智能汽车等智能终真个快速发展使得数据易于存储和提取。
场景方面,人工智能早期运用和生活场景的结合比较少,比较成功的运用包括搜索广告系统(比如Google的AdWords)、网页搜索排序(例如Yahoo!和微软的搜索引擎)、垃圾邮件过滤系统、部分语音机器人等。而在如今,智能无处不在,场景的纵深比较之前有了很大扩充,一方面源于产品和场景的丰富、人类需求的升级供应了智能运用的场景,另一方面也源于生产效率已经走向一个瓶颈,依赖人力本钱投入等办法增加产出的办法越来越不效率,倒逼生产力向智能化改造。
从场景引发需求,智能终真个遍及构建了大数据的环境,技能的进步供应了算力的可能,而算法难点的占领打通了理论到运用的通道,四者相互增强,勾引AI家当的上游——芯片家当快速发展。