本文将会利用AutoML Vision alpha来构建和支配一个机器学习模型,从原始数据网络到做事模型,以及介于两者之间的统统!
该模型可识别不同类型的椅子,以及其他一些项目,以便我们进行更好的丈量。
许多人一贯在呼吁要访问AutoML Vision alpha,我们轻微理解一下事情流程,见告你如何利用它,纵然你尚未得到期待名单。
那么......什么是AutoML?
Cloud Vision API可以识别椅子,但它在识别别的方面也是通用的
使AutoML如此引人瞩目的一个缘故原由是自定义模型。现有的模型和做事(如Cloud Vision API)可以识别给定的图片中是否有一张椅子,但是如果您是设计和制造椅子的,并且须要一种方法来对库存中各种品牌的椅子进行分类,那该怎么办?如果能够利用“自定义”视觉API,也便是说可以识别特定的椅子,那就完美了。这也是AutoML Vision的目标。
这是一个黄色的椅子
这张图片有更多的椅子
AutoML Vision会将许多标记的照片作为输入。这时候可能有人要问有多少张照片?空想情形下,每个工具大约有数百个是好的。以是现在可以走出去开始拍照,如果您厌倦了点击该快门按钮,您可以考试测验我一贯在利用的替代方法。
拍照 - 用视频的那种!
为了更随意马虎为AutoML Vision捕获数据,我通过捕获我感兴趣的椅子的视频来网络我的演习数据,然后利用ffmpeg来提取帧。
作者拍了一些各种不同的户外椅子的视频。同时还拍了一些关于它们放置的桌子的视频,以及一辆自行车,这只是为了让事情更有趣。
我们一起来看看这段录像的例子。
在这个视频里有不同形状、风格和颜色的椅子。但没有视频长度超过30秒。短片中有一张桌子,还有一个自行车,这是我们将要研究的数据。
拆分视频
我们想要的终极状态是一个CSV文件,每个图像有一行、两列,第一个用于在Google云端存储中定位图像,第二个用于标签,如“赤色椅子”或“表格” ,或'蓝色椅子'。
为了便于整理,将每个视频都放入自己的文件夹中。然后我们可以依次在每个视频文件上运行ffmpeg。
提取帧后,每个标签都会有一个文件夹,个中包含该标签的图像。这是组织图像的一种方便的方法,并且比拥有所有图像的一个大型文件夹更大略。
接下来,我们可以利用gsutil将图像上传到Google云端存储,每个标签复制一个文件夹的文件夹构造:
构建数据
AutoML须要一种方法来理解在哪里可以找到所有照片以及每张照片中的工具。我们须要创建一个CSV文件,列出希望包含在数据集中的每个图像的标签。有很多方法可以实现这一点,但这里选择启动本地的Jupyter条记本并创建一个Pandas数据帧以导出为CSV文件。
好的,现在我们有一个CSV文件描述我们数据集中所有图像的位置和标签。我们准备演习我们的模型!
这便是将图像加载到AutoML Vision后的样子。 CSV文件已关照平台每张图像的精确标签。如果您没有标记您的图像,那没紧要,UI中内置了工具,可以帮助辅导您完成标记过程并显示哪些图像仍旧没有标记。
第2部分:演习和支配AutoML Vision
演习模型
这便是我们一贯在做的所有设置,它使AutoML Vision能够获取数据并在最前辈的图像模型上演习您的数据,自动找出适当的超参数,如网络构造。
但在你开始考试测验更高等的模型之前,我建议先从大略的模型开始,然后看看它的表现如何。这将为您供应一个基线,您可以根据该基线来比较其他模型的相对性能。
演习开始后,你可以去闲步,或者喝咖啡。至于花费的韶光须要详细考虑我们的数据量。
评估您的模型
一旦演习完成,您将得到有关您的模型的各种统计数据,您可以利用它来查看其实行情形以及是否有一些图像被缺点标记,或者其他方面是否值得更正,然后进行再演习。
在我们的案例中,由于我们通过设计网络了非常详细、干净的数据,因此我们得到了一些非常高的指标。然而,真正主要的是它如何在新的、看不见的数据上实行。
预测韶光!
作者拍了一些照片放到模型中,看看他会返回给我们什么。
让我们试试这张包含自行车以及黄色和蓝色的椅子的图片。
结果图像被认为紧张是自行车,但它也有一点黄色和蓝色的椅子,它们处于背景中,并且在这张照片中的突出特色不那么突出。
那我们再试试另一个吧。
这张照片大多的大部分是黄色的椅子,但也有蓝色的椅子的一部分。这个模型判断它紧张是黄色的椅子,还有一把蓝色的椅子。
那么,我们再看看这张紧张是蓝色椅子的照片怎么样?
是的,那显示的紧张是蓝色的椅子,还有一些桌子,有趣的是,还有一点黄色的椅子,这是猜想之外的。并非所有事情都是完美的,但到目前为止,最佳选择已被证明是非常好的。
末了,这张照片怎么样,与末了一张非常相似,但前排座椅是黄色的?模型会如何判别呢?
哇,前排的黄色椅子可是霸占了大片韶光!
考试测验在模型和数据集中找到差距,可以更好地理解如何根据您的用例网络更强大、更具代表性的数据,这非常有趣。
结束
值得指出的是,此时,可以通过其REST API调用该模型。该做事利用Cloud ML Engine的在线预测功能,供应定制的自动缩放预测做事,并对我们的数据集进行培训。
您可以从任何做事器或连接互联网的设备通过REST API调用您的做事
关于这统统的奥妙之处在于,一旦您的数据管道全部完成,那么演习和支配机器学习模型的过程完备是免费的!
这使您可以专注于使数据处于良好状态,并避免构建得当的打算机视觉机器学习模型的寻衅。
请把稳模型名称下方的自动支配的注释
现在,如果你能体谅我,我会去拍更多彩色椅子的视频,这样我就可以扩展我的AutoML Vision模型的数据集了!