量子位 宣布 | 公众号 QbitAI
刚刚,华为业界算力最强的AI芯片正式商用。
并且宣告自研AI框架MindSpore开源,直接对标业界两大主流框架——谷歌的Tensor Flow、Facebook的Pytorch。
华为AI芯片昇腾910之前已经发布,现在正式商用,对标英伟达Tesla V100,主打深度学习的演习场景,跑分性能2倍于英伟达。
华为轮值董事长徐直军说,这是华为全栈全场景AI计策的实践表示,也希望进一步实现华为新愿景:打造“万物互联的智能天下”。
但毫无疑问,华为入局,自研AI打算架构,肯定会进一步影响AI根本技能和架构格局,特殊是美国公司的垄断。
MindSpore发布后,华为已经实现了完全的AI生态链,加上此前发布的ModelArts开拓平台、Atlas打算平台,席卷了从芯片、框架、支配平台到运用产品完全层级。
在当下这个大环境中,这些动作也具备了自主自强、不受人掣肘的寓寄。
如今现状,AI领域的关键技能,比如算力、框架、算法等等,紧张还是由少数几家美国公司供应。
比如演习芯片,紧张由英伟达(GPU)、Google供应(TPU);框架则是Google的Tensor Flow、Facebook的Pytorch等成主导;原创AI算法的发明,也只是在少数几个厂商或者研究机构手中。
这直接导致一些企业想要参与AI的时候,创造门槛很高,除了须要大量数据之外,还须要面临算力稀缺、硬件昂贵、人才难找等问题。
现在,华为要用实际行动改变这一现状。
AI领域的“鸿蒙OS”MindSpore,与其他主流的框架不同,这是一款全场景的AI打算框架,也是一款“操作平台”。
不仅仅可以用于云打算场景,也能够运用到终端、边缘打算场景中。
也不仅仅是一款推理(支配)框架,也可以用来演习模型。
徐直军表示,这背后可以实现统一架构,一次演习,到处支配,可降落支配门槛。
从这个角度来看,MindSpore也可以视为AI领域的“鸿蒙OS”。
此外,这一框架面相的也不仅仅是开拓者,也面向领域专家、数学家、算法专家等等在AI中角色越来越主要的人群。
徐直军先容,MindSpore的界面上也更加友好,在表达AI问题求解的方程式时,更加便利,更易于算法的开放与创新,推动AI运用的遍及。
用MindSpore可降落核心代码量20%,开拓门槛大大降落,效率整体提升50%以上。
通过MindSpore框架自身的技能创新及其与昇腾处理器协同优化,有效战胜AI打算的繁芜性和算力的多样性寻衅,实现了运行态的高效,大大提高了打算性能。
除了昇腾处理器,MindSpore同时也支持GPU、CPU等其它处理器。
与此同时,MindSpore也采取新AI编程措辞,单机程序可分布式运行,是一个全场景框架。全场景是指MindSpore可以在包括公有云、私有云、各种边缘打算、物联网行业终端以及消费类终端等环境上支配。
而且,这一框架将会开源开放,可灵巧扩展第三方框架和芯片平台。
当然,徐直军说,如果用华为的昇腾系列芯片,效果会更好,可进行全离线模式实行运算,充分发挥神经网络芯片算力,实现最佳性能搭配。
毕竟,MindSpore作为华为全栈全场景AI办理方案中的核心步骤,是首个Ascend Native开源AI打算框架,会更适宜达芬奇架构的AI芯片,尤其是昇腾910。
而且MindSpore针对现在越来越大的演习模型做了更多的优化,用户无需理解并走运算的细节,只需理解单芯片支配,就可以在打算集群上进行并行打算。
徐直军表示,MindSpore会在明年第一季度正式开源。
昇腾910正式商用
昇腾910,在2018年10月华为全连接大会期间曝光,采取华为自研的达芬奇架构,号称“算力最强的AI处理器”,采取7nm工艺制程,最大功耗为350W,实测310W。
这次发布用于上市商用,直接对标英伟达Tesla V100,主打深度学习的演习场景,紧张客户面向AI数据科学家和工程师。
紧张性能数据如下:
半精度为(FP 16):256 Tera FLOPS;
整数精度(INT 8):512 Tera FLOPS,128通道 全高清 视频解码器- H.264/265。
在去年全连接大会上,华为就和友商比拟了一下,battle的参赛选手包括谷歌TPU v2、谷歌TPU v3、英伟达 V100和华为的昇腾910。
“可以达到256TFLOPS,比英伟达 V100还要赶过1倍!
”
相同的功耗下,昇腾910的算力是V100的两倍,演习速率更快,用户须要得出演习产出的韶光会更短。在范例案例下,比拟V100,昇腾910的打算速率可以提升50%-100%。
在范例的ResNet50 网络的演习中,昇腾910与MindSpore合营,与现有主流演习单卡合营TensorFlow比较,显示出靠近2倍的性能提升。
而且徐直军还在会后明确表示:价格还没定,但肯定不会高!
2018年10月,在华为全连接大会上,徐直军公布了华为全栈全场景 AI 计策操持,将数据获取、演习、支配等各个环节席卷在自己的框架之内,紧张目的是提升效率,让AI运用开拓更加随意马虎和便捷。
全场景包括:消费终端 (Consumer Device)、公有云 (Public Cloud) 、私有云 (Private Cloud)、边缘打算 (Edge Computing)、IoT行业终端 (Industrial IoT Device) 这5大类场景。
重点在于全栈,包含基于达芬奇架构的昇腾系列芯片(Max、Lite、Mini、Tiny、Nano)、高度自动化的算子开拓工具CANN、MindSpore框架和机器学习PaaS (平台即做事) ModelArts。
随着昇腾910正式商用以及MindSpore框架正式推出,华为全栈全场景AI办理方案愈发完善,竞争力也会随之上升。
而且,华为之AI,也不仅仅是关乎华为本身业务,也该当从更加宏不雅观的角度去核阅。
当下,AI落地已经成为无可争议的大趋势,大方向。
但中美关系日趋紧张的情形下,中国到底如何,也引发了更多关注。
近日,Nature最新揭橥了一篇,名为“Will China lead the world in AI by 2030?”,提出问题的同时,也核阅了中国AI发展的现状。
文章中援引艾伦人工智能研究所数据显示,在最顶级的10%高引用论文中,中国作者占比在2018年已经达到26.5%,非常靠近美国的29%。如果这一趋势持续下去,中国将在今年超过美国。
须要场景?数据?金钱?人才?等等,这些都不差。
但为什么,卡脖子隐忧,AI领域依然存在。
核心还在于算力(芯片)与根本技能。
Nature文章就指出,中国在人工智能的核心技能工具方面仍旧掉队。目前全天下的工业和学术界广泛运用的开源AI平台TensorFlow和Caffe,由美国公司和组织开拓。
框架方面,百度的PaddlePaddle飞桨也不断打破,虽然发展势头非常好,却还是显得势单力簿。
更关键的是,中国在AI硬件方面的掉队非常明显。环球大多数领先的AI半导体芯片都是由美国公司制造的,如英伟达、英特尔、谷歌和AMD等。
中国工程院院士、西安交通大学人工智能与机器人研究所所长郑南宁,接管Nature采访时说:“我们在设计可支持高等AI系统的打算芯片方面也缺少专业知识。”
虽然海内也有不少公司在努力,比如阿里、百度、依图、地平线等等,都涉足了AI芯片领域,但大部分都聚焦在终端SoC和推理上面,用于演习的大型算力芯片并不多。
郑南宁估量,中国可能须要5到10年才能达到美国和英国根本理论和算法的创新水平,但中国会实现这一目标。
来自柏林智库的政治学者Kristin Shi-Kupfer也表示,根本理论和技能方面的贡献,将是中国实现长期AI目标的关键所在。
她同时强调,如果没有在机器学习上没有真正的打破性进展,那么中国在人工智能领域的增长,将面临发展上限。
以是,Nature的问题:中国AI,到2030年能够领先环球吗?
本日华为给出一种解法,但统统还只是开始。
你怎么看?
— 完 —
诚挚招聘
量子位正在招募编辑/,事情地点在北京中关村落。期待有才华、有激情亲切的同学加入我们!
干系细节,请在量子位"大众年夜众号(QbitAI)对话界面,回答“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技能和产品新动态