来自华盛顿大学、脸书和谷歌的研究职员创建了第一个端到真个深度学习系统,将YouTube上的足球比赛视频转化为动态的3D全息图。他们从国际足联比赛视频中提取了12000张球员的2D图像,然后利用3D数据进行卷积神经网络演习。研究职员说,重塑足球比赛视频并不随意马虎,面临着许多寻衅。他们在描述这项事情的一项新研究中写道:“我们必须估计摄像机相对付比赛园地的位置与角度,对每个球员进行检测和追踪,重构他们的体型和姿势,并进行组合重修。”
该系统能够准确预测深度图,并将其与彩色胶片相结合,以3D形式重构每个球员。但是,目前足球的重构仍在进行中。他们写道:“我们实现了首个端到端系统的目标,但足球的重构还未实现,这是未来连续努力的方向。”
研究职员将比赛重置于虚拟的足球场上,在世界上任何地方通过3D或AR设备便可以从多种角度不雅观看比赛。他们利用微软的全息透镜智能眼镜进行了测试,只管该系统只适用于合成的比赛视频,但他们在YouTube上找了十个高分辨率的职业足球比赛视频,对其进行了测试,结果非常好。
他们将于6月18日至22日在犹他州盐湖城举行的年度打算机视觉与模式识别会议上展示他们的研究成果。
科普百分百·助力科普中国,让科学知识在网上和生活中盛行起来。温馨提示:以上为科普百分百网上阅读所浏览内容,转载分享只为知识传播和学习宣扬,本文内容仅代表原作者不雅观点,如有见地建议,请私信留言,我们会及时处理。欢迎关注,感激。