量子位 宣布 | "大众号 QbitAI

在视觉盲区里潜藏的障碍物,传感器能“看”得到吗?

答案是,不仅可以,分辨率乃至能达到亚毫米级别。

这项来自斯坦福、莱斯大学、普林斯顿和南卫理公会大学等高校的最新研究,仅采取商用相机和标准指示器中的激光光源,就隔着1米远,利用AI看穿了拐角里1厘米字母的样子容貌。

通俗激光通俗镜头AI就能看穿去世角里的障碍物可达亚毫米级

并且,只须要两张 1/8s 曝光长度的图像,就能达到300μm的分辨率。

作者之一的Prasanna Rangarajan阐明说,能以较短的实时成像曝光韶光识别工具,这一点对付运用而言是至关主要的。

而另一位作者,普林斯顿大学打算机科学助理教授Felix Heide指出:

非视距成像在医学成像、导航、机器人技能,以及国防领域都有主要的运用代价。

我们的事情推动该技能在各种运用领域更进一步。

分辨率达到亚毫米级别

实验装置是这样设置的:

激光从光源射出,经由反射形成虚拟光源打到隐蔽工具上,而后,隐蔽工具反射的光会在粗糙墙壁上形成散射光(称为虚拟探测器),研究职员会利用这些斑点图案来重构被遮挡的工具。

虚拟探测器和视觉盲区里的隐蔽工具,间隔约为1米。

激光光源为500mW,532nm的CW激光源(Azur Light Systems ALS-532)。
镜头则采取了焦距180mm的佳能长焦微距镜头。

实验中,研究职员移除了相机的保护玻璃,以减少内部反射。

结果表明,在CNN的“解谜”下,仅利用两张 1/8s 曝光长度的图像,就可以以300μm的分辨率,重修1m外的识别工具。

△「7」和「F」高度均为1cm用CNN办理喧华相位复原问题

此前,阻碍非视距(non-line-of-sight,NLoS)成像技能分辨率提升的,是相位复原(PR)的局限性,PR方法常日对噪声非常敏感。

为了充分利用低信噪比的丈量数据,从漫反射斑点图案中重修工具,研究职员开拓了针对特色噪声合成数据进行演习的AI算法。

详细改进如下:

利用频谱密度估计的结果,剖析与NLoS干系的噪声分布。
提出了一种天生PR演习数据的新方法,无需实验、建模场景语义。
为PR问题提出了一种新的映射,并为基于学习的PR提出并剖析了新的平移不变丢失函数。
证明CNN比传统方法更快且更可靠。

研究职员利用稀疏的“非构造化”图像数据集演习CNN。
数据集来自Berkeley Segmentation Dataset 500。

△上为边缘探测器成像,下为其对应的自干系

比较于传统PR算法,这一基于CNN的方法对噪声更加鲁棒。
也便是说,新方法可以在更弱的光芒下事情,帧速更高。

还原看不见的去世角

利用传感器肃清视觉去世角的研究,实在早已展开。

比如MIT人工智能实验室的图像重修算法:根据影子,还原看不见的去世角。

去年,英特尔实验室和斯坦福大学的科学家则受地震成像启示,利用扬声器和麦克风来捕获声波反射韶光,还原隐蔽工具的图像。

而提高系统的分辨率,让这项技能更早运用到自动驾驶等领域之中,办理实际问题,则是研究职员们持续努力的方向。

传送门

论文:https://www.osapublishing.org/optica/fulltext.cfm?uri=optica-7-1-63&id=425998

GitHub:https://github.com/ricedsp/Deep_Inverse_Correlography

干系宣布:https://venturebeat.com/2020/01/16/researchers-propose-system-that-taps-ai-to-see-hidden-objects-around-corners/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一韶光获知前沿科技动态