机器之心编译出品
参与:Sane,微胖
很长一段韶光以来,人工智能的研究都集中在让机器理解书面笔墨,比如著名的图灵测试(Turning Test),证明了机器能够像人类一样智能地回答书面问题。
而如果让机器变得更聪明,仅仅处理笔墨显然是不足的。事实上,人类心智非常长于视觉处理。从所见当中识别图案、物体以及文本情景的能力让我们很智能,这种能力也是人的实质特色。
不过直到最近,打算机都对图片束手无策。比如,除非人为添加一些标签和注释,否则机器就无法理解图片,图片也便是成了无用的文件。
但是,这种尴尬的情形正在发生变革。一大批能看懂图片的人工智能技能已经来到人间,下面不妨来看看机器之心的盘点:
谷歌 TensorFlow
5月份谷歌推出 Google Photos时,媒体关注的焦点是:人工智能和图片搜索结合后所产生的强大功能。谷歌声称(并且用户也很快确认),征采特定某人,你会找到对方从现在到婴儿期间的照片。搜索品种名,你就能找到相应品种狗的照片。把名字和食品种别结合起来,比如输入「最大披萨」,就能锁定特定图片。
这款运用发布之初,媒体无从得知谷歌究竟研发了多永劫光。不过,一些搜索功能在Google+上涌现一年多了。
两周前,谷歌以TensorFlow平台形式开源了自己的人工智能平台。
只管TensorFlow并不是第一个开源人工智能平台,但是,它是与谷歌强大图片搜索关系最为密切一个。
开源TensorFlow意味着,包括初创公司在内的其他公司,能够利用谷歌的这个开源平台,快速将人工智能和图片结合起来。只管谷歌并未开放人工智能关键技能,包括在浩瀚做事器上运行的能力。谷歌也没有开放让其如此强大的用户数据库。但是,谷歌的此举毫无疑问将刺激全体机器学习和人工智能创业生态的发展。
我们也期待着基于TensorFlow的各种震荡新运用能于明年进入市场。
Facebook Photo Magic
Facebook近期开始在Messenger运用上测试一项新功能——Facebook Photo Magic。这是一个可选运用,它会扫描手机相册照片并对它们进行面部识别处理。Photo Magic会识别照片中的人物(他们也是你的Facebook好友),建议你和他们一起分享这些照片。
毫无疑问,这项功能给Facebook带来了双重上风。首先,它鼓励用户更多在Messenger上分享。其次,它改进了识别。但是,仅仅这项便利功能是不足的,用户实际上可以附和或谢绝在任意灯光条件、角度和其他参数条件下,Facebook利用人工智能对面部和名字进行匹配。Facebook人工智能节制的照片越多,识别效果也越好。
令人吃惊的是,纵然遮住了脸部,Facebook的「面部识别」一样能能识别出你的脸部。这个别系也关注发型、姿势、衣着和身材。(请把稳,我们并不清楚Facebook是否已经实现了这种前辈系统,但很明显的是,它从用户照片中网络数据。)
Facebook 的Photo Magic拓展了图片库来源,它不仅网络Facebook(社交网站),还网络Messenger(谈天运用)的数据,扩充了数据量。Photo Magic还鼓励附和或否定匹配结果,提高数据质量。
很明显,Facebook终极目标是识别任意场景中的任何人,纵然在看不清脸部的恶劣灯光条件下。毫无疑问,未来Facebook的人工智能会扫描和剖析环境,创造可市场化的线索——比如,如果某人在照片里常常打棒球,广告商就可以利用这个信息锁定棒球迷,只管他在上传照片的笔墨里并没有表露出这种兴趣。
毫无疑问,他们也打算通过不雅观察图片中一起涌现的人,进一步建立社交图谱。
微软牛津项目(Project Oxford)
这个工具包支持人工智能各个方面的运用,包括口语,视频和其他媒体。但是,最震荡和最强大的功能莫过于牛津项目现在支持开拓者通过牛津人脸运用平台接口项目( Project Oxford Face API)检测图片中的人物表情。
譬如,用牛津项目处理一张包含5个人的照片,识别照片中的脸以及每个人的表情——快乐,愤怒或恶心。
这项功能在新的高度,像人类一样「理解」图片质量。不雅观看他人照片时,人们关注的最主要特色便是个人或群体的情绪状况。
Pinterest Visual Search
Pinterest日前发布了全新的图片搜索功能,它能帮助用户创造更多的信息乃至帮助购买他们在固定照片里看到的产品。
首先,在 Pinterest的图片中选中任一物体(来回拖动一个盒状标识)。然后,搜索工具会找到具有相似图案和颜色的相似物,系统会将最匹配的结果链接到购买按钮上,点击这里就能购买该产品。
这个功能因此伯克利视觉和学习中央(Berkeley Vision and Learning Center)的深度学习人工智能为根本的。
这种照片人工智能运用可以说是万维网照片的雏形,在这个万维网中,每张图片中的每个物体都与等同物或者相似物、干系物彼此关联。
CloudSight
一家名为CamFind的图片识别和视觉搜索公司,今年推出了一个「云视觉」(CloudSight)的公共运用平台接口。
这个API支持开拓者利用CamFind的人工智能剖析图片内容。这样的扫描大多数情形下具有高度特定性,比如,能识别汽车的制造和模型,或者狗的品种以及食品的详细类型。一旦剖析出图片中的物品,开拓者就可以利用这些信息来获取网络上的笔墨信息。
Deepomatic
Deepomatic开拓了一种做事型软件智能搜索引擎,它能识别图片中各种各样的数据。Deepomatic热衷时尚。它不仅匹配颜色,图案和其他数据,还能识别图片中的物品,并将它与一个全面的时尚产品数据库进行匹配。
Deepomatic网站声称,其技能仿照了人类大脑吸收视觉信息的办法并用这种办法来理解各种观点。
远大前景
每当想到这样一个令人惊喜的新天下:能够理解照片内容的人工智能将无处不在,具有强大扩展潜力且唾手可得时,这些无限可能性就会令人叹为不雅观止。
而且,这仅仅是一个开始。在绝大多数情形下,这项技能险些都能通过API,开源程序或做事化处理得以运用实现,因此,我们已经站在了未来天下的入口:图像AI将和网络搜索一样遍及,成为这个天下的一个基本特色。为了真正仿照人工智能,打算机必须有视觉,现在它们有了。
©本文由机器之心原创编译,转载请联系本公众年夜众号得到授权。
✄------------------------------------------------
添加个人微信jiqizhixin2014,更加方便查看机器之心文章;申请加入「机器之心前沿科技谈论群」,一起磋商科技与人的美好关系吧!
加入机器之心
网站开拓:三年以上网站开拓履历,熟习WordPress
全职编辑:卓越的英语听说读写能力,热爱前沿科技
兼职作者、演习生:精良的英语翻译能力,干系专业背景
内容小组和 PSI操持
请发送简历到hr@almosthuman.cn或添加个人微信jiqizhixin2014。
↓↓↓点击「阅读原文」查看机器之心网站,获取更多精彩内容。