黄畅博士,地平线机器人技能( Horizon Robotics )联合创始人&算法副总裁。
本科、硕士以及博士毕业于清华大学打算机科学与技能系,曾经在美国南加州大学和 NEC 美国研究院担当研究员。
2012年加入百度美国研发中央,2013年参与组建百度深度学习研究院( IDL ),任高等科学家、主任研发架构师。
长期从事打算机视觉、机器学习、模式识别和信息检索方面的研究,作为干系学术界和工业界的有名专家,揭橥的论文被引用超过3350次,拥有多项国际专利。
他开拓的人脸检测技能,创造了天下上首次打算机视觉技能被大规模运用的成功范例,盘踞80%数码相机市场,并且被苹果 iPhoto 等诸多图像管理软件所采取。
他带领百度 IDL 图像技能团队卖力公司内各种图像核心技能的研发,推出了全网人脸图像搜索、PK大咖、全网相似图像搜索、自然场景笔墨识别、百度移动图像搜索、图片凤巢等主要产品。
在校期间得到2006年度微软学者奖学金,2007年清华大学精良博士毕业论文、2007年北京市精良博士毕业论文等名誉,“可视媒体几何打算的理论与方法”项目得到2012年高档学校科学研究精良成果奖一等奖,参与国家973操持项目“面向三元空间的互联网中文信息处理理论与方法”。

初识人工智能运用研究

黄畅参加的第一个学术项目,就和解决实际问题干系。

大三那年,人工智能还处在一个低谷中。
但一个有时的机会,让黄畅跟随恩师艾海舟一起,加入到清华与日本欧姆龙公司的技能互助项目,研究图像识别领域中非常主要的人脸检测问题。
当时的他还不知道,后来的研究成果成为了早期打算机视觉技能被大规模商业运用的成功范例,出身了天下上第一款人脸检测专用芯片。

人工智能算法探秘地平线技能三剑客解读

时至今日,这项技能以“芯片+软件”的模式已广泛做事于生活中的各个角落,从数码相机、智好手机,再到诸如苹果iphoto这样的软件系统,霸占了大量的市场份额。

这项技能实现了我们如今随处可见的镜头自动人脸对焦和曝光肤色的智能调度功能,完备改变了自相机出身以来的人物拍照办法。

当时,人工智能方面的大多数技能还很难在工业界找到适宜的发展方向,由于技能还不成熟,大多数都还勾留在实验室阶段。
乃至到黄畅博士毕业的时候,人工智能行业形成规模仍旧是遥遥无期。
很多从业者都以为这行“不靠谱”,纷纭转到互联网或者金融行业了。

而那次项目的成功,则代表着人工智能在实际运用中迈出的主要一步。
这个成功的范例向众人证明了人工智能在运用方面可开拓的巨大潜力,让人工智能开始受到干系人士的重视,并得到越来越多的投入。
对黄畅个人而言,也让他对人工智能未来的乐不雅观态度更加武断,并一起走下去。

十年循环,持续深耕

此后十年,黄畅用了比别人更少的韶光读完硕博,并受邀去美国南加州大学跟随Prof. Ramakant Nevatia读了两年博士后,随后加入地处硅谷的NEC美国研究院。
这段事情里黄畅收成了两个“生命之重”——真正以工业界的视角对人工智能进行深入思考研究,以及结识了亦师亦友的余凯。

返国后他加入百度IDL,带出一支精良的图像技能团队,做出了全网人脸图像搜索、PK大咖、全网相似图像搜索、自然场景笔墨识别、百度移动图像搜索、图片凤巢等主要产品。
鉴于这些精良的事情成果,他和他的团队得到了百万美金的“百度最高奖”。
而在实际运用中,这些产品也展现出了巨大“威力”,比如图片凤巢的技能成果,就使百度的广告收入提高了5%-6%。

2007年他离开清华前夕,和其他同学评论辩论未来行业发展趋势时,曾说过,“这个行业在5-10年的韶光里一定能取得重大打破、得到广泛运用。
”这句预言也在本日得到了很好的印证——从2012年开始,以深度学习为代表的一大批人工智能得以复兴,乃至这一年被称为“人工智能遍及年”。

深度学习中,被大规模用于图像识别的卷积神经网络

2015年,他加入地平线后,又做起了“算法+芯片”方面的研究事情。
只不过十年的经历和思考,让他对 “算法+芯片”有了前所未有的深刻思考和清晰认识。

算法要用来办理实际问题

在加入地平线时,黄畅就已经形成了一套自己的AI算法研究代价不雅观,那便是:算法是用来办理实际问题的,它是工具,而非目的。
这也是全体地平线算法团队所坚持的理念,故而在很多公司很多团队还在算法数据集里争着“刷第一”时,地平线的算法研究方向已经在奔向下一个目标了。

详细来说,他认为,如果想让算法能真正的办理实际问题,在考虑算法之前,必须对这些繁芜的实际问题进行精确的建模(formulation),选择乃至定制得当的系统(system),基于大量数据(data)驱动,结合模型(model)和知识(knowledge)的表达来办理这一实际问题。
分开开这条轴线,我们做的算法将不具有现实意义。

现在许多人谈论算法,每每忽略了要办理的问题的实质,没有精确的抽象和建模,也缺少一个坚实的系统去承载并做可持续的积累。
这样过于强调算法自身的结果,常日会形成过分简化的建模(即采取单一的算法和系统,去办理实际上非常繁芜的问题),结果导致算法难有本色性的打破,更无法运用于真正的产品中。

譬如说,在自动驾驶领域,有些公司号称在利用深度学习做端到真个演习,直接学习从传感器的输入到掌握器(刹车、油门、转向等)的输出的函数映射。
我们无法对这种黑盒模型进行有效的剖析,在利用中出了故障很难搞清楚究竟是什么缘故原由造成的。
而自动驾驶是一个对可靠性哀求极高的领域,须要考虑许多长尾条件下的corner cases。
这种建模办法没有对自动驾驶这个问题做出精确的形式化描述,而在此根本上构建系统并研究算法,效率十分低下乃至是徒劳无功。

基于这些思考,在黄畅带领下,地平线算法团队在许多主要的算法研究方向上持续努力考试测验,包括向基于贝叶斯网络的推理系统和面向感知-决策-掌握的增强学习系统等,努力把地平线的算法技能水平推向一个新台阶。

基于深度神经网络增强学习的理性决策

除此之外,在全智能万物互联的时期背景下,人工智能技能越来越多的从云走向端,出身了“端上AI”这个巨大的市场。
这也意味着在地平线的算法研究中,还要增加一个新的思考维度——和芯片更好地结合,实现高精度、高效率、高吞吐量、低功耗、低本钱的特点,以此代替原来动辄本钱上千美元,能耗几百瓦的GPU架构。
依赖算法、硬件等团队的努力,地平线已奠定了嵌入式人工智能环球领导者的地位。

罗恒:忽略Trick,将难以办理实际问题

罗恒,地平线机器人技能资深算法研究员,卖力深度学习模型压缩与加速。
2011年博士毕业于上海交通大学,后随Yoshua Bengio从事博士后研究,2014年加入百度深度学习实验室,参与深度学习在搜索中运用、PaddlePaddle研发等事情。
2016年8月加入地平线机器人公司。

罗恒有些微胖,时常自嘲“要减肥”,藏在方框眼镜之后的一双眼睛睿智有神。

作为一名算法工程师,他的生活常常处于高速的脑力运转之中,这让他的每一秒韶光都显得宝贵,走路疾步带风。

2011年,罗恒在上海交通大学博士毕业后,跟随Yoshua Bengio从事博士后研究。
回顾起自己走上深度学习的进程,罗恒抚了抚眼镜,“那是段很有趣的经历”,似是做好了讲故事的准备。

师从AI大师Yoshua Bengio

研究生时,打算机专业的罗恒有时理解到机器学习的知识,惊觉十分有趣,由此开始持续关注机器学习方面的学术动态。
博士期间,罗恒看到了Yoshua Bengio教授关于深度学习的技能报告,只管当时还不太懂深度学习,但罗恒依然强烈地感想熏染到,这可能机器学习接下来最大的打破。

“看Vapnik的书,以为我自己没遇上这波(研究热潮),我就想,下一波是什么?当时就以为深度学习,该当是下一波学术上的热潮,我就这样开始走上深度学习的研究之路。

罗恒的博士后导师:Yoshua Bengio

Yoshua Bengio教授是蒙特利尔学习算法研究所主任,CIFAR操持CIFAR神经打算和自适应感知操持联席主任,加拿大统计学习算法研究主席,和Geoffrey Hinton、 Yann LeCun并称为当今人工智能“三巨子”,他们一同缔造了2006年开始的深度学习复兴,实现了人工智能的第三次研究热潮。
他带领一批研究生和博士后开展机器学习,在全体学术领域有着极大影响力(Google Scholar在2016年中期创造超过40000篇引文,H指数为84)。

同时YoshuaBengio也在不断指挥他的团队去研究深度学习措辞,包括比来取得令人激动的造诣的神经机器翻译系统,比如最新版谷歌翻译,其翻译水平乃至可以和专业的人工翻译媲美。

那时候这位AI大师刚好在招收博士后,虽然罗恒只揭橥了两篇论文,但这两篇文章却受到了Yoshua Bengio的极大认可,在和罗恒面谈之后,Yoshua Bengio将他收入自己门下。
就这样,罗恒飞往加拿大,开始攻读深度学习博士后,踏上了研究深度学习的学术旅程。

压缩和加速模型,实现嵌入式AI

当罗恒学成归国,已是2014年。
返国后他创造,工业界已经开始有深度学习研究了,“研究事情能够开始实用,这是很难得的,我创造自己不但遇上了研究上的一波热潮,还遇上了实用的一波的热潮。
恰好那时候余凯老师在百度创办IDL,于是我就选择了加入。

加入百度IDL,罗恒和他的团队紧张在做的事是,如何把深度学习用在搜索排序上。
但是他创造,近年来为了隐私、安全、避免对网络的依赖,越来越多的深度学习算法模型开始在端上运行,这对模型的大小、速率、能耗、性能都提出了现实的哀求。
罗恒逐渐觉得到,深度学习下一波发展是从云走向端,使得各种智能模型在我们的身边唾手可得。
于是,2016年他加入了余凯创办的地平线,专攻神经网络模型的压缩和加速。

地平线要做的是,高性能低功耗的IP开拓,供应端到端、软硬结合的人工智能结合方案,推进嵌入式人工智能家当生态链的搭建。
在这个过程中,算法的模型压缩和加速是技能实现的必要一环。

乐为人师,重视Trick素养

在地平线,大家都称罗恒为“罗老师”,这或许也是受到他的恩师Yoshua Bengio的影响。
Yoshua Bengio是人工智能三巨子当中唯一一个依然坚持在学术岗位的深度学习大师,他全身心投入在学术界,进行纯粹的学术研究,带头培养成千上万个科学家和工程师们。

罗恒从恩师那里传承了为人师表的精神,除了致力于运用研究,他对付人才培养也十分看重,尤其看重他们Trick素养的提高。

刚开始进入人工智能行业的同学每每以为研究无从下手,虽然有很多理论的文章,但彷佛对实际用途不大,常常感到迷惑。
和其他人专一理论不一样,罗恒善于带着他们转换思路,从Trick入手,利用这些Trick,更好地带领新人办理实际问题,比如利用演习好的神经网络对数据做采样,更快创造数据中的问题。

“机器学习的很多研究都是从理论出发,但实际上这样很难去描述一些现实的问题。
而trick是一种实用主义的方法,这从研究的角度看上去可能显得不那么优雅,但在很多实际问题上,忽略trick都是不明智的。
”Trick对付所有人来说,都是一种办理实际问题的好方法,对付刚入行的同学来说,更是如此。

招纳新人,学术运用两手抓

在人工智能研究的大潮中,算法人才从来都是紧缺资源,罗恒一贯期盼着有志同道合的人能够成为自己的伙伴,而他也会像自己的老师一样,带领着新生力量,投入到深度学习的研究当中。

这次的绝地武士演习生操持,模型的压缩和加速方向招收3名演习生,罗恒是mentor。
他感到这是一种奇妙的转换,在六个月的韶光里,他将带领演习生们共同追求学术上和运用上的目标。
“演习生来到这里,和我们一起写代码,做实验,验证各种想法,有比较好的结果就写论文,同一个课题下,我们也会带领演习生考试测验多种办理方法,在试错中得到进步。

罗恒一贯在等待着。

黄李超:让算法成为一种生活办法

黄李超,地平线核心算法工程师。
毕业于英国帝国理工。
返国后任职于百度深度学习研究院,事情内容涵盖物体检测、姿态及关键点定位等尖端核心技能,演习期间就独立开拓出基于全卷积网络的物体检测算法DenseBox,一举成为百度IDL核心算法,奠定其在算法领域中的领先地位。
该算法针对中国特有的繁芜路况,让单目摄像头也能做到精确的环境感知。
在与参加评测的其他机构如三星研究院、NVIDIA、UCSD、斯坦福、中科院等竞争中,黄李超开拓的DenseBox脱颖而出,获威信数据集FDDB、KITTI榜首。
在检测的速率和准确率上,大大超越了同类算法中的佼佼者如YOLO 、SSD和faster-R-CNN。
2015年9月加入地平线后,黄李超卖力过两大方向。
一是算法研发与优化,包括卖力演习各种模型,如人脸检测模型、人脸属性和关键点定位模型、以及ADAS方向的车辆和行人检测模型;二是平台搭建与优化,即演习算法平台的开拓以及CNN预测库的性能优化。
目前在地平线紧张卖力物体检测和图像分割方向。

探索物体检测前沿算法

工程师对自己设计的算法总是怀有某种分外的情绪,正如Alphago之父哈萨比斯在Alphago降服围棋高手李世石时兴奋不已一样,谈及在物体检测领域颇有名气的DenseBox算法的开拓,黄李超彷佛也有说不完的想法和故事。

设计DenseBox最初的目的,是用深度学习做物体检测。
虽然深度学习在2013年旁边就被运用于物体检测领域,但其代表性的算法架构却一贯不足直接和高效。
早期基于CNN的物体检测方法OverFeat,虽然有着很好的设计,但由于性能和效率问题一贯没有得到很好的运用。
虽然后来Ross Girshick等人开拓了R-CNN算法,在一些数据集上有更好的表现,但它的缺陷也显而易见的——region-proposal常日会很多,直接用CNN分类的话非常耗时;同时,R-CNN演习须要多个步骤,不足直接。

在大家仍选择沿用R-CNN方法马首是瞻时候,2014年冬天,还在百度IDL演习的黄李超决定开拓一套新的物体检测算法。
更早的OverFeat这个事情给了他启示:既然在图像上卷积等价于利用滑动窗口分类,为什么不直策应用全卷积网络做整图的物体检测呢?因此,他基于自己的理解,设计出一套端对真个多任务全卷积模型,直接回归物体涌现的置信度以及它的相对位置。
同时为了能够更好地处理遮挡严重的物体,提高小物体的召回率,他还率先在检测的网络中引入了上采样层,并领悟浅层网络得到的特色,得到更大尺寸的输出层。
为了对演习样本进行筛选,降落误检,他还率先利用了Online Hard Negative Mining的策略,这在后来的一些论文中被证明是很有效的。

目标检测示意图:输入多尺度图像,经由CNN处理,输出目标框 引自:DenseBox: Unifying Landmark Localization with End to End Object Detection

后来他还对DenseBox进行了一次关键性的优化,让原来的检测网络引出多个分支,大大降落了图像金字塔的规模。
这一优化,使得在相同打算量的模型下,原来在GPU上耗时数秒的720P图像的人脸检测,不到一秒即可完成。
如果用更小的模型,在CPU也可以做到每秒好几帧的速率。
这一改变成为推动DenseBox落地的“临门一脚”,让它真正在产品线上能够可用。

DenseBox最先运用在人脸检测上,表现出了很好的性能,后来开始逐步运用于车辆检测等方向。
而优化后的DenseBox更是被广泛运用到IDL的干系项目组,如人脸和OCR(光学字符识别)项目,极大提高了检测的准确率,至今仍是百度无人车的主要算法之一。
加入地平线后,DenseBox在各个平台上衍生出了多种不同性能和速率的模型,也成为了地平线的核心算法。

除了物体检测算法的研发,黄李超来到地平线之后,在工程方面也做出了培植性的成绩。
他在一个月内独立搭建了一个跨平台的轻量级CNN预测库,性能达到开源深度学习平台Caffe的两倍。
同时在ARM平台上进行的定制性优化,较Caffe速率提升了2-6倍。
同时,地平线初期落地的所有模型,包括人脸检测模型、人脸属性和关键点定位模型、以及ADAS方向的车辆和行人检测模型,也都由他一手演习。
今年在地平线嵌入式人工智能计策的关键一环中,黄李超作为核心成员参与了地平线第一款芯片CNN模块的设计和算法验证。

纵不雅观黄李超在人工智能领域的探索进程,DenseBox开拓、FDDB/KITTI榜首、深度学习预测库、业界顶尖、地平线芯片,这些彷佛都可以成为他身上亮闪闪的标签,却都无法大略地定义这个一贯生动在物体检测领域前沿的探索者,由于这个眼睛里散发着光芒的人,有太多的想法和探索的能量,因而无法大略地用词汇定义。

科技剑客,随性与执着

采访黄李超最大的感触便是他的随和与坦然,讲起自己的经历,他时常低头一笑,又闲闲道来。
他也坦言自己的随性,当年DenseBox虽在2015年初就被早早地开拓出来,这一成果比同一期间的Fast(er)-R-CNN系列提前数月,但干系的论文直到9月才在arxiv上发布,究其缘故原由竟是他

“当时

DenseBox在KITTI上名列榜首,性能远超faster-RCNN和Regrionlets

但是,他的随性仅仅适用于他的人生不雅观,他对事情的激情亲切正好相反,是相称执着的。
在开拓DenseBox的时候,同期险些没有可以参考借鉴的事情,因而所有的内容和算法都须要根据自己的直觉去判断,“须要不断的考试测验,如果效果不好,就要剖析它的缘故原由。
只要认定了这个方法可行,就绝对不能放弃。
”正是他的坚持让DenseBox在检测算法领域立稳了脚跟,通过不断的更新和改进,它仍傲踞地平线的核心算法之首。

他的随性和执着构成了他剑客般的性情,对人生随性而坦然,对技艺执着又精益求精。
在科技的时期,他便是摆荡锋芒、披荆斩棘的剑客。

算法,应该是一种生活办法

“未来的目标嘛,我希望做出更好的算法,也让自己的算法能够在更大的平台上利用,让自己的成果惠及更多的人。
”谈及未来的愿景,黄李超如是说。
最近二十年来,我们分别经历了PC互联网、移动互联网的热潮,如今这些热潮已靠近尾声,而下一次热潮已紧随而来——人工智能。
随着万物互联时期的到来,端上的人工智能将带来巨大的市场机会。
尤其是在自动驾驶和智能家居领域,存在于每一个智能设备里的AI芯片会是重中之重。

在万物互联的人工智能时期,生活将与算法密不可分

而算法在个中扮演的角色便是,和芯片完美结合,供应软硬结合的嵌入式人工智能办理方案,也以此得到重生和更广阔的运用。
好的算法,可以为我们的生活带来诸多便利;也预示着算法将在不久的未来,潜移默化地成为我们的一种生活办法。