先来大略梳理下AR的核心技能
AR(Augmented Reality),是在现实天下中叠加虚拟信息,也即给现实做“增强”,这种增强可以是来自视觉、听觉乃至触觉,紧张的目的均是在感官上让现实的天下和虚拟的天下领悟在一起。
个中,对现实天下的认知紧张表示在视觉上,这须要通过摄像机来帮助获取信息,以图像和视频的形式反馈。
通过视频剖析,实现对三维天下环境的感知理解,也即是说,AR与视频也有着千丝万缕的联系。

目前AR紧张的交互办法包括语音识别和手势识别。
语音识别在目前已经取得了较大进展,海内如百度、科大讯飞、云知声等都是个中的佼佼者。
以是更须冲要破的是手势识别的成熟商业化,比如海内的AI+视频初创企业极链科技便曾在世界人工智能大会上展出过一款线下互动体验小游戏,如果AR的手势识别得以打破,便可以将这种操作办法利用于更多元的方面。

在AR的流程中,有着这样几个关键点:

首先是3D环境理解。
要理解看到的东西,紧张依赖物体/场景的识别和定位技能。
识别紧张是用来触发AR相应,而定位则是知道在什么地方叠加AR内容。
定位根据精度的不同也可以分为粗定位和细定位,粗定位便是给出一个大致的方位,比如区域和趋势。
而细定位可能须要精确到点,比如3D坐标系下的XYZ坐标、物体的角度。
根据运用环境的不同,两种维度的定位在AR中都有运用需求。
在AR领域,常见的检测和识别任务有人脸检测、行人检测、车辆检测、手势识别、生物识别、情绪识别、自然场景识别等。

AI与AR可同进弗成同退

在感知现实3D天下并和虚拟内容领悟后,须要以一定办法将这种虚实领悟信息呈现出来,这里面须要的便是AR中的第二个关键技能:显示技能, 目前大多数的AR系统采取透视式头盔显示器,这个中又分为视频透视和光学透视,其他的代表有光场技能、全息投影等。

AR中的第三个关键技能在于人机交互,用以让人和叠加后的虚拟信息互动,AR追求在触摸按键之外自然的人机交互办法,比如语音、手势、姿态、人脸等,用的比较多的语音跟手势。

人工智能和AR的技能关联:

在人工智能领域有几个观点常被提及,如深度学习、机器学习,在学术领域包括人工智能在内几大领域均有自己的研究界线,而在普遍意义上,我们常说的是泛意的人工智能,涵括所有“让机器像人一样”的技能的运用方向。

深度学习是实现机器学习的一种技能办法,而机器学习是为了让机器变得智能,去达到人工智能。
可以说人工智能是终极目标,而机器学习是为了实现这个目标延伸出的一个技能方向。
在这个中,还有另一个主要观点为打算机视觉,紧张来研究如何让机器像人去“看”,是目前人工智能观点中的一个主要分支,这也是由于人类获取信息最紧张的办法之一便是视觉,目前打算机视觉已经在商业市场发挥代价,比如人脸识别;自动驾驶中读取交通信号和把稳行人以导航;工业机器人用来检测问题掌握过程;三维环境的重修图像的处理等等。
这些观点既有区分也有一定范围的重叠。

AR究竟是不是人工智能:

对AR从业者来说,空想的状态是用更智能的AR终端去取代智好手机,以是对付用户来说打仗利用AR首先受影响的是内容,其次是终端,AR家当链如果粗暴划分包括技能供应商、智能终端研发公司,以及AR内容供应商。
在这个中,AR设备供应商不可避免关注硬件技能,如底层的芯片、电池、光学镜片等,以及硬件本身的性能优化,而内容供应商更方向于在现有技能根本上优化内容及表现。
以是我们可以说AR技能供应商,或者说在底层算法研发上有一定成绩的AR公司是人工智能公司。

对公司来说,特殊是创企会把底层技能转化为成熟的产品或做事,这可能是如无人机、AR智能终端、机器人等,也可能是行业办理方案,以达到商业目的,并且这已经成为在沸腾声音之后,媒体、企业以及大众对AI企业的期待和哀求。

小结:

作为技能驱动的商业领域,无论是AR还是人工智能的其他多数方向,技能间隔完备成熟还有很长的路程要走,在全体家当链逐渐繁荣,关注商业化实现的同时,也须要有更多如旷视科技、极链科技一样的公司机构去不断拓展技能边界,建立核心竞争力,让行业爆发更大的代价与潜力。
如此一来,AI时期中国弯道超车当可期。