智东西8月24日,昨日,2018中国高校学生AI演习营项目(DeeCamp)展示暨卒业仪式在北京大学举行,该项目由教诲部中外人文互换中央、创新工场AI工程院和北京大学联合主理。在卒业仪式上,8支获奖小组分别作了项目展示,包括AI评美图、AI说唱、自动驾驶等。
在卒业仪式后,智东西同少数媒体采访了教诲部中外人文互换中央副主任杨晓春和创新工场AI工程院实行院长王咏刚,就我国AI人才的现状、如何培养尖端AI人才、AI公司的商业化落地等问题进行深入互换。
一、DeeCamp AI演习营该演习营是海内首个高校AI人才培养操持——2018年“中国高校AI人才国际培养操持”的履行项目之一,由创新工场于去年发起,另一项目为“高校西席AI培训班”。演习营吸引了环球600多高校近7000多名中国学生报名,在经由笔试、口试层层筛选后,来自85所国内外高校的300逻辑学生被录取参加1周集中授课+4周动手实践。个中,本科、硕士、博士霸占的比例分别为54%、39%和7%。
这次高校AI国际人才培养操持为公益性子,老师和学生的培训课程都完备免费。图灵奖得到者John E.hopcroft、深度学习专家吴恩达等6家国际顶尖高校的10位AI专家和创新工场、旷视、科大讯飞、谷歌等AI技能企业的AI专家分别担当学术导师和家当导师,辅导学生分为28个小组完成15个实践课题,末了从中选出8支良好军队。他们做的课题有机器臂3D视觉系统、3D人体骨架点检测、多摄像头行人轨迹和行人动作剖析、AI自动作词作曲、AI电影推举、AI打即时计策游戏、农作物病虫害检测等。
在卒业仪式上,获奖的8支团队进行了申报请示展示。教诲部国际互助与互换司副司长徐永吉、北京大学常务副校长高松院士、教诲部中外人文互换中央副主任杨晓春、创新工场CEO李开复以及AI工程院实行院长王咏刚等有关单位的领导和专家为学员颁发卒业证书。
二、AI也懂美:评价妍媸,为诗配图
在8个获奖团队中,有两个团队的作品都和美学干系,一个是让AI评价美图,另一个是让AI生产美图。
1、给图像的妍媸评个分
在卒业仪式上,首先颁发的是DeeCamp精神奖,获奖小组是美图辅导的图像美学评价小组,他们做的项目是让AI像人类一样判断图片的妍媸。该小组做了一个好玩的微信小程序,只要上传一张照片,就会得到该图的评分和评语。
由于不同时期不同族群对美学都有不同定义,如果AI能够公道地评判某个拍照作品的基本审美高度,就能为不雅观众供应一个客不雅观的第三方代价参考。目前该领域最前沿的一篇论文是今年4月谷歌提出的NIMA模型,这篇论文的均匀值预测比较准确,但分布预测不足准确。
为了使图片评价的分布更靠近不雅观众审美,该小组利用包含约25万张图片的AVA数据集和近14000万张图片的ImageNet数据集,采取端到端模型,利用深度神经网络自动学习与图像美学评价干系特色,并考虑到参与投票人数对打分结果的影响,设计了一种新的的基于统计概率加权的EMD Loss。他们模型的评分均值预测和谷歌论文的NIMA达到了同量级效果。
末了,该小组分享了几个AI美学评价的运用前景,个中一个很有商业代价的便是和摄像机结合,自动采集有美感的照片或自动天生有美感的海报。
2、从诗词天生有风格的图片
DeeCamp最佳方案奖由知乎辅导的基于文本语义的图片天生小组收入囊中。古诗词是文化自傲的主要载体,如果有个工具将诗词中的意象和情绪相结合,将大大降落理解诗歌的门槛。该小组做的便是基于诗歌意象和情绪理解、意象图片内容的天生,和对图片进行情绪着色并进行水墨风格迁移。
在文本方面,该小组搜集5万多首唐诗,利用规则匹配和CNN提取意象,准确率达91%;在情绪判别方面,他们人工标注了2276多首诗歌的正负向情绪,利用Word2Vec字向量剖析和情绪字典自动标注数据,以“句子”为单位进行情绪判别,精确率达80.1%。为了实现情绪着色,他们人工搜集了基于荷、草、柳、梅、沙漠、山、云、燕8个意象的2500张单意象图片和2000张多意象图片,利用WGAN-GP和改进的ACGAN等模型实现情绪着色和风格迁移。
该项目有几个商业展望,一个是面向孩子和外国朋侪的教诲APP“看图识古诗”,另一个是基于古诗词的意象和情绪判断后天生对应场景和风格的配图。
三、AI玩笔墨:滋扰环境认糊图,高能谈天唱Rap笔墨是不同于图像的另一种描述天下的办法,下面三个项目都是用AI实现笔墨和措辞方面的运用。
1、比百度、腾讯更强大的OCR
得到最佳工程奖的小组由美团公司辅导,做的是环境不可控场景下拍摄文档地址笔墨识别(OCR)。笔墨识别每每面临拍摄环境不可控和地址字段识别的寻衅,比如拍照拍糊了、闪光灯滋扰、中英文数字稠浊、多行紧凑笔墨等情形都会影响识别结果。
据小组卖力人表示,该小组在短短一个月的韶光,从不知道什么是OCR,到实现高识别率的OCR功能。他们利用DenseNet进行图像特色提取,用短文本分类TextGrocery进行地址判断,在剔除滋扰和模糊匹配和校正后,其OCR识别率超过了腾讯和百度。他们将实现的功能集成在小程序中。该小组也总结了这一项目的未来改进方向,包括地址纠正、更多数据、优化模型、压缩参数等。
2、能斗图的陪聊机器人
最佳技能奖的得到者是知乎公司辅导的刘看山陪聊机器人小组。他们所做的机器人高效实现了一流谈天机器人必备的险些所有核心技能环节,不仅可以回答笔墨,还能像人一样回答图片和表情包。大家又多了一个可以愉快调戏的AI机器人。
该小组利用来自知乎、小黄鸡、微博、豆瓣的1000多万语料,在经由敏感词筛选后,他们利用Seq2Seq文本天生算法和北大孙老师在18年2月提出的DPGAN模型,将基于文本的模块、基于检索的模块和基于天生式的模块结合,做了相似度匹配。其匹配办法都在GPU上进行,匹配速率非常快。
3、AI也能写歌词唱Rap
拿到最佳Demo奖的是由创新工场创新奇智辅导的AI有嘻哈小组,他们所做的AWLyrics能够2分钟植出一首嘻哈歌曲。利用者选择一个主题,输入一个起始句,其项目就能天生押韵的嘻哈笔墨,还能进行语音合成,让机器唱嘻哈。
该小组对SeqGAN模型做出改进,增加输入语句的编码,并将原来天生器的丢失函数改成Penalty-based Objective。在押韵功能上,他们考试测验了Reward-based和Rule-based两种方案。其卖力人表示,这个项目的未来事情还有很多,比如根据Beat自动创作嘻哈歌曲、运用于诗歌、平仄和押韵等各种文本天生,以及运用于图像捕捉,即用编码器对图片编码后交给天生器等。
四、AI擅追踪:识别用户行为,“迷你”自动驾驶末了这三个项目则出色地整合了技能架构,展现了学生们全面均衡的实践能力,
1、追踪原麦山丘的人流
由创新工场创新奇智辅导的人流动线追踪小组得到了最佳团队奖。他们重新零售的场景和需求出发,希望通过人流动线追踪技能精确识别用户行为。实在验场景选在原麦山丘新奥店,该小组利用三路摄像头进行基于热力争的人流检测和追踪。他们还通过摄像头标定将数据可视化,展示年事分布、性别分布等视频数据的统计结果。
课题实现的难点紧张由货架遮挡、视角、光芒和相似着装。针对这些难点,小组用地板格更换黑白格标定摄像头,基于姿态估计检测,利用Deep SORT和ReID领悟的技能进行轨迹处理和多帧检测结果匹配,标注位置和性别的先验信息进行赞助判断。
2、仿照完全无人驾驶体系
由景驰辅导的基于分模块的自动驾驶小组摘得最佳运用奖。该小组展示了在虚拟环境下实现的无人驾驶仿照视频,其项目基于分模块架构,分成高精度舆图与定位、感知、决策方案和掌握四个模块。
其技能前辈性在于,定位采取了基于SLAM定位和航迹推算的定位领悟算法,决策方案利用了Dijkstra搜索的全局路径方案。在掌握部分,小组利用了Pure Pursuit算法,结果偏差比较小。该小组表示,目前他们已有能适应多车道变道超车的超车导航点天生算法,能够基于繁芜环境进行实时动态导航。
3、“迷你版”自动驾驶小车
2018 DeeCamp之星奖压轴揭晓,获奖者是由景驰辅导的自动驾驶小组,他们利用监督性端到端演习,做出了“迷你版”自动驾驶车Devil Car。在利用了Carla仿真器仿照自动驾驶功能后,他们将功能与硬件结合,首先利用4万张图的数据集进行演习,使小车能在楼道完成直行和转弯。随后,他们将小车的运用处景扩展到室外,通过演习7万张图的数据集,使小车能在1000米旁边带有自然障碍物的校园环路上进行弯道行驶和障碍躲避。
在未来,这个项目能实现的功能可以扩展到无人喷洒车、无人道路清洁车、北大校园导游车等无人车,可在无人汽车中嵌入端到端局部掌握,还能助力语义分割、障碍物检测等领域,降落标注本钱。
五、对AI学生的建媾和希望李开复表示给出做科研的几点建议,一是要具备坦诚公开的科研精神,学会感谢借鉴的算法;二是在做系统时要考虑覆盖全部场景;三是在Demo展示中多列详细数据,并且多与不雅观众互动,使其亲自感想熏染项目的可行性和真实性。
教诲部司长徐永吉则对学生提出三点希望,一是充分利用AI实验室等平台资源,参与AI运用项目研究与开拓等活动;二是培养“AI+X”的学习思维和能力,加强AI与其他专业领域的领悟;三是保持人才间的互换,协同磋商办理AI问题。
他表示,将在未来的项目履行过程中扩大国际师资的引入力度,联合更多高校和企业共同参与,并探索设立专项留学奖学金,以进一步提升我国高校AI运用型人才的培养质量,助力中国AI家当升级。
六、我国AI行业的人才现状和发展方向在闭幕式结束后,教诲部中外人文互换中央副主任杨晓春和创新工场AI工程院实行院长王咏刚接管了智东西等媒体的采访。
▲教诲部中外人文互换中央副主任杨晓春(左)和创新工场AI工程院实行院长王咏刚(右)
1、从中美差异看我国AI人才的短板
目前中国的AI家当处在发达发展的上升期,但发展也呈现明显的构造不屈衡。美国的高端AI人才培养有多年的积累和秘闻,有高校、政府、企业之间的互动,有投资和被投企业之间的各种家当链,生态环境比较成熟。而我国既短缺像美国那样顶级的AI领军人才,又短缺能和中国的基于大数据、商业模式创新良好结合的AI商业化人才。在兼备自然科学、工程、人文方面的综合性知识和知足家当技能的发展方面,人才都是一个短板。
2、商业化AI人才应具备综合本色
王咏刚认为,成功的AI工程化人才该当具有综合本色,能将AI的科技和工程化场景很好的整合。他们至少应具备三种本色,第一要有踏实的基本功,第二有对前沿技能的跟踪能力,第三个是对算法在运用处景的需求、在运用处景的架构里面的交互等问题有基本的观点。
3、填补人才短板,培养尖端人才
AI侧重运用处景,人才培养必须要走校企领悟的机制,应搭建跨学科的培植。我国在AI技能、AI根本算法和根本知识的本色上并不比美国差,提升的关键在于培植学习期完全的生态环境,这须要老师的勾引以及教诲部、各个投资机构、企业的一起努力,以填补整体生态环境的不敷。
4、AI还不能做感性的事情
王咏刚坦言,目前AI还没有办法具备人类的情绪和审美体验。虽然让机器去画画、作曲、写文章等许多考试测验,但是这些AI技能还处在低幼期的临摹阶段,技能职员会连续探索这种AI创作的可能性。
5、AI公司商业化落地
AI公司的商业化落地有两大特点,一是须要长期投入,逐步去学习行业知识和理解行业需求,然后定制化地作出办理方案。二是领域细化,定制化需求多。这对所有的AI创企都提出两个寻衅,一个是须要好的AI科学家和好的商业化团队,另一个是必须有足够的资金,充分的生理准备来打持久战。
结语:AI人才储备战已经打响近年来,随着AI技能的迅速发展,环球都在迎来新一轮的智能时期变革。在这个数据为王的时期,抢占AI市场最关键的便是资金、数据和人才。个中,人才是打赢任何一场科技战役的终极杀手锏。
根据《2017年环球人工智能人才白皮书》显示,目前环球AI人才仅约30万人,截止到去年10月,我国AI人才缺口已达到百万级。虽然就目前来看,无论是数量、质量还是人才构造,我国AI人才都暂时无法和在打算机尤其是AI领域积淀数十年的美国相提并论。在当下人才缺口面前,高校AI人才培养操持的涌现无疑是给我过AI教诲添了一针强心剂。
本次演习营8个获奖的学生作品中都是具有寻衅性且与商业落地紧密结合的项目,从这些作品中,我们不仅可以看到当下AI前沿发展趋势,也看到了学生们出色的技能和工程实力,相信随着更多产学研结合的人才培养操持的实现,学生们的创意也会给家当界的AI落地带来更多启示。