大数据文摘专栏作品

作者:Christopher Dossman

编译:笪洁琼、Conrad、云舟

呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!

首场ACRV机械人视觉寻衅全卷积神经收集实现交互式医学图像瓜分

AI Scholar Weekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一扫而空每周AI学术的前沿资讯,文末还会不定期更新AI黑镜系列小故事。

每周更新,做AI科研,从这一篇开始就够啦!

本周关键词:ACRV机器人视觉寻衅、基于视觉的移动操作、Sim2Real策略、DC-SPP-YOLO模型

本周热门学术研究

新的概率目标检测寻衅:第一场ACRV机器人视觉寻衅。

对付机器人运用来说,回答目标是什么以及目标在哪这一问题,并供应一种空间和语义不愿定性的衡量标准,是目标检测须要优先办理的问题。

日前,由Google支持的澳大利亚研究委员会旗下的机器人卓越视觉中央开启了第一场关于概率目标检测的寻衅赛。
打算机和机器人视觉的寻衅哀求参与者检测视频数据中的工具,并供应空间和语义不愿定性的准确估计。

图1:示例图片来自用来产生寻衅测试数据的仿照环境,第一排和左下图是用于测试序列的环境,右下图是用于验证序列。

这场寻衅没有设置门槛,人工智能社区中对目标检测有兴趣的人都可以参加,这是一场很不错的寻衅。
寻衅的测试数据集包含来自18个仿照室内视频序列中的56,000多张图像,将在用于寻衅的公共做事器中进行评估,该做事器仅在公开比赛阶段开放。
参与者将得到名次并共享5000澳元奖金。

潜在运用及效果

这一新的寻衅是对概率目标检测的先容,将现有的目标检测任务提升到高端机器人运用中的空间和语义不愿定性。
总的来说,它将提高机器人运用在物体检测方面的技能水平。

更多细节:

https://nikosuenderhauf.github.io/roboticvisionchallenges/object-detection

原文:

https://arxiv.org/abs/1903.07840

一种基于视觉的移动操作机器人图像天生方法

研究职员设计了一种系统,该系统可以利用单个输入图像从期望的视点为特定工具天生一组图像,供移动操作机器人利用。

所提出的方法是一种深层神经网络,演习它从多个视角“想象”物体的外不雅观。
它将工具的单个RGB图像作为输入,并返回一组RGB和深度图像(位深度图像),从而肃清了传统、耗时的扫描。

虽然深层神经网络已经实现了单视角重修,但由于重修过程打算量大,很难直接得到重修工具的精准细节。
该方法采取基于CNN模型的目标检测器从自然环境中提取目标,由神经网络天生一组RGB和深度图像(位深度图像,目前Ps软件中的位深度为16位)。
该方法已在天生图像和真实图像上进行了测试,证明其是非常有效的。

潜在运用与效果

基于图像天生具有为重修物体供应更好的空间分辨率的潜力。
因此,该方法在移动操作机器人领域中是有必要的。
这种方法有可能帮助机器人更好地理解一个物体的空间属性,而不须要做一个完全的扫描。

原文:

https://arxiv.org/abs/1903.06814

为Sim2Real策略迁移增强合成图像

由于实际数据和合成数据之间存在着领域差距,而且很难将在仿照器中学习到的策略传输到真实场景中。
在过去,领域随机化(随机领域数据天生,domain randomization)通过利用随机变换(如随机工具形状和纹理)增强合成数据来办理这一寻衅。

近年来,研究职员对领域随机化的研究做出了新的贡献,对Sim2Real迁移的增强技能进行了优化,使其能够在没有真实图像的情形下实现与领域无关的策略学习。

他们设计了一种利用目标定位进行深度图像增强的高效搜索方法。
在策略学习过程中,利用天生的随机变换序列来增强合成深度图像。

为了评估这种迁移的程度,研究职员提出了一种目标位置估计的委托任务,这种任务只须要很少的真实数据。
新方法大大提高了在真实机器人上评估操作任务的准确性。

潜在运用及效果

该方法在仿照环境中促进了操作策略的有效学习。
这是非常有益的,由于仿照器可以促进可伸缩性,并在模型演习期间供应对底层空间的访问。
此外,新的方法不须要真实图像来实现策略学习,可以运用于各种操作任务。

原文:

https://arxiv.org/abs/1903.07740

新的DC-SPP-YOLO模型实现了更精确的实时目标检测

研究职员提出了一种DC-SPP-YOLO方法来提高YOLOv2目标的检测精度。
DC-SPP方法通过优化根本网络的连接构造来改进YOLOv2,并引入了多尺度局部区域特色提取。
因此,这个提出的新方法比YOLOv2更精确。

它达到了靠近YOLOv2的目标检测速率,并且比传统的目标检测方法如反卷积单镜头检测器(DSSD)、标度可转移检测网络(STDN)和YOLOv3更高。

DC-SPP-YOLO特殊利用YOLOv2根本网络中卷积层的连接来加强特色提取,使消逝梯度问题最小化。
在此根本上,提出了一种改进的空间金字塔池,并将多尺度局部区域特色串联起来,使网络能够更全面地学习目标特色。

基于一种新的丢失函数演习DC-SPP-YOLO模型,该丢失函数由均方偏差和交叉熵组成,能更准确地实现目标检测。
实验结果表明,DC-SPP-YOLO在PASCAL VOC和UA-DETRAC数据集上的mAP均大于YOLOv2。

潜在用场及影响

通过加强特色提取,利用多尺度局部区域特色,DC-SPP-YOLO实现了优于YOLOv2的实时目标检测精度。
在安全监控、医疗诊断、自动驾驶等方面,该方法可用于实现更精确的、最前辈的打算机视觉运用。

详情请见:

https://arxiv.org/abs/1903.08589

通过全卷积神经网络实现交互式医学图像分割

最近的研究提出了一种“智能”的深度学习半自动分割方法,能够在医学图像中对感兴趣的区域进行交互描述。
这种提出的方法采取了一种FCNN的架构来实行交互式二维医学图像分割。

那么它是如何利用交互的?网络被演习成每次只分割一个感兴趣的区域,并考虑到用户以单击一次或多次鼠标的形式输入的内容。
该模型还被演习去利用原始2D图像和一个“勾引旗子暗记”作为输入。
然后它会输出特定分割工具的二进制掩码。
研究职员已经证明了它可以被用于在腹部CT等分割各种器官。
这种新方法供应了非常准确的结果,可以根据用户的选择以快速、智能和自发的办法进行纠正。

潜在用场及影响

该方法可以快速地供应高真个二维分割结果。
它也有潜力办理紧迫的临床寻衅,并可用于提高分割精度的浩瀚医学成像运用,如肿瘤定位、手术方案、诊断、手术内导航、虚拟手术仿照、组织体积丈量等。
其他运用包括可视化、放射治疗方案、3D打印、图像分类、自然措辞处理等等。

原文:

https://arxiv.org/abs/1903.08205

其他爆款论文

利用3D点云增强可穿着机器人的环境分类。

原文:

https://arxiv.org/abs/1903.06846v1

用于道路驾驶图像实时语义分割的预演习模型。

原文:

https://arxiv.org/abs/1903.08469

第一种基于事宜的运动分割数据集学习方法和事宜相机的学习管道。

原文:

https://arxiv.org/abs/1903.07520

新的研究表明,你可以通过Wi-Fi感应来提高视觉SLAM算法的准确性。

原文:

https://arxiv.org/abs/1903.06687

即插即用的磁共振成像(MRI)。

原文:

https://arxiv.org/abs/1903.08616

AI新闻

谷歌在德国作曲家巴赫生日当天发布了AI涂鸦来纪念他。

详情请见:First ever AI doodle that allows users to make music.

https://www.newsweek.com/google-doodle-bach-birthday-when-march-21-22-1366826

结合打算密集型的人工智能运用程序和最近发布的新人工智能做事器。

详情请见:AI Server Enabled with NVIDIA GPUs for edge computing

https://www.marketwatch.com/press-release/inspur-releases-edge-computing-ai-server-enabled-with-nvidia-gpus-2019-03-19?mod=mw_quote_news

真的有可能创造出类似人类的人工智能吗?

详情请见:How to create AI that is more human