编 | 董温淑
智东西1月18日,近日,卡内基·梅隆大学、脸书等机构的研究职员提出了一个新的AI环境探索模型。这个新模型综合了传统环境探索模型和基于学习方法的环境探索模型的优点,更大略和不易出错。
这项研究已经揭橥在学术网站arXiv上,论文标题为《利用主动神经SLAM学习探索环境(Learning To Explore Using Active Neural SLAM)》。
论文链接:https://arxiv.org/pdf/2004.05155.pdf
一、ANS模型:真实仿照探索环境
导航能力是智能代理的核心能力之一。导航任务有许多形式,比如点目标任务辅导航到特定的坐标,语义导航任务辅导航到去特定场景或工具的路径。
不论哪一种任务,在未知环境中导航的核心问题都是如何高效地探索尽可能多的环境。这样才能扩大在未知环境中找到目标的机会,或者在有限的韶光里有效地预映射环境。
传统的探索模型事理是用传感器不雅观察几何体。之后有研究者提出了基于学习的导航模型,该模型依据RGB图像直接推测出几何体。
基于学习的导航策略通过端到端(end-to-end)演习神经网络实现,可以处理原始的传感器数据,直接输出代理该实行的操作。这种策略有3个上风:
1、提高了输入办法选择的灵巧性;
2、提高显式状态估计偏差的稳健性;
3、通过学习节制真实天下的构造规律性,使代理更有目的性地行动
理论上端到真个学习策略有上述上风,但也有局限性。
首先,纯粹从数据中学习映射、状态评估、路径方案可能会非常昂贵。因此,以往的端到端学习依赖于模拟学习和以百万计的履历框架。
其次,以往针对端到端学习策略的研究缺少真实性。比如利用的是合成室底细况数据库SUNC、简化了代理动作、运行环境去除了传感器噪音等。
从表现来说,端到真个学习策略也每每比不须要任何学习的传统方法差。
为理解决全面端到端学习的局限性,卡内基·梅隆大学、脸书、伊利诺大学厄巴纳-喷鼻香槟分校的研究职员推出了“主动神经即时定位与舆图构建(ANS,Active Neural SLAM)模型”。
实验设计上,研究职员只管即便使模型演习环境更真实,用到了生境仿照器和两个基于真实情景的数据库(Gibson和Matterport),不限定代理的动作,还仿照了传感器噪音。
二、缩小搜索范围,兼顾搜索性能和效率
本项研究中,导航模型的任务是在固定时间内覆盖最大范围。覆盖范围定义为舆图中已知被穿越的总面积。
ANS模型包括一个学习神经即时定位与舆图构建(SLAM,Simultaneous localization and mapping)模块,一个全局策略(global policy)和一个局部策略(local policy)。它们通过舆图和一个剖析路径方案器相连。
层次化和模块化的设计和剖析方案的利用,大大减小了演习过程中的搜索范围,同时提高了性能和样本效率。
模型示意图
演习过程中,学习神经SLAM模块产生自由空间舆图,并依据输入的RGB图像和运动传感器数据预测代理的姿势。SLAM模块的学习提升了输入办法的灵巧性。
全局策略利用代理的姿势来霸占自由空间舆图,并把学习现实天下环境布局的构造性规则作为长期目标。全局策略可以探索真实天下环境的布局。
长期目标可以为局部策略天生短期目标。局部策略通过学习,直接从RGB图像中映射出代理该当做出的动作,呈现可视化反馈。
模型运行过程示意图
三、ANS模型能探索更大范围,比基线模型性能精良
利用Gibson演习集,研究职员完成了对ANS模型的演习,运行了1000万帧探索任务的所有基线。结果如下表。
运行结果基于模型在14个未知场景中994次运行的结果进行均匀。与最佳基线的24.863m^2/0.789比较,模型的覆盖率为32.701m^2/0.948。这个数值解释,与基线比较,ANS模型在穷尽探索上更有效。
研究职员还比拟了模型和基线在较大演习集、较小演习集、全部Gibson演习集中的运行效果。
较小演习集中,ANS模型能在500步探索完未知环境,而基线运行1000步后仍只探索了位置环境的85~90%(上图中)。
较大演习集中,随着情节的发展,ANS模型与基线之间的差距会扩大(上图左)。
基线模型中,代理常常只探索局部区域,这解释它们无法记住长期视野的探索区域,不能进行长期方案。比较之下,ANS采取全局策略,可以影象探索过的区域,有效地方案并实现长期目标。
受到结果鼓舞,研究职员用ANS模型支配了一个环境探索机器人。通过调度摄相机的高度和垂直视野,并匹配栖息地仿照器,机器人成功探索出一个公寓的生活区域。
结语:ANS模型效率更高,未来或有更多运用
ANS导航模型战胜了之前的基于端对端学习策略的毛病,基于更真实的数据库进行演习,终极探索效率有所提升。
研究职员认为这个模型在未来或许会有更多运用。“未来,ANS模型可以扩展到繁芜的语义任务,比如语义目标导航和回答详细问题,这将创建出一个能捕获工具语义属性的舆图。”
其余,这个模型也可以与先前确当地化事情结合,在此前创建的舆图中重新定位,使之后的导航更高效。
文章来源:VentureBeat,arXiv