我在大年夜厂演习AI用鼠标拉框一次赚3分钱

我们和何信通话的时候，他正在做数据标注的事情。

电脑屏上的图片里，三三两两的人在操场上，或是在跳绳，或是在围不雅观。
何信要做的是用鼠标将正在跳绳的人框出来。
“说出来你可能都不相信，便是画这一个框。
”何信阐明道，“好比你现在打开电脑，然后摁住鼠标右键拉一下，在桌面上便是一个框便是3分钱。
”

何信在做数据标注事情，何信供图

何信做数据标注的事情有一年多，他自己成立了一个创业小团队，团队里有十几个人。
他们的项目涉及百度、网易、阿里等互联网大厂，他也做细致的“打点”事情，类似一个鞋的边框打点一周，二十几个点，挣一到两角钱。

我在大年夜厂演习AI用鼠标拉框一次赚3分钱

“阿里众包、京东微工、百度众测、有道众包……”市情上这样的产品有很多，利用碎片化韶光得到收入、操作大略无门槛是它们最紧张的卖点。
这类互联网大厂推出兼职平台，紧张以众包的形式给用户分配任务，用户通过完成任务来得到报酬。
但相较这些大厂的有名产品而言，兼职平台们的下载量并不高。

我们查询产品下载量统计平台七麦数据后创造，AppStore中阿里众包、腾讯搜活帮、京东微工、百度众包等四款产品，近30日日均下载量未超过2000。

图源：七麦数据查询韶光：2021年4月27日

从产品数据上看，互联网大厂的兼职App只能说不温不火。
在灵巧用工、兼职经济高度发展确当下，这类兼职App为什么没做起来？都是谁在做这份事情？

一、收益太少，羊毛难薅

互联网大厂出品的兼职APP中，运作流程是：平台发布任务，用户领取任务验收后得到收益。
综合各平台来看，紧张有数据标注、数据采集、数据转写事情。
细分到详细领域，又分为文本、图片、语音、视频等部分的信息处理。
任务的价格一样平常在0.1元到几十元不等。

在腾讯搜活帮里，李元接了十几单任务，赚了不到两块钱。

放弃倒不是由于钱少，而是由于这份事情过于机器化，重复性劳动让李元很不适应。
他大学读的是电子信息工程专业，毕业后事情也比较清闲。
出于赢利和丁宁韶光的目的，李元下载了这款众包类型的软件。

众包，普通来讲，便是从大众那里探求资源。
它本意是指一个公司或机构把过去由员工实行的事情任务，以自由志愿的形式外包给非特定的（而且常日是大型的）大众志愿者的做法。

以京东微工的数据标注为例，在最新一期的任务里哀求对文本进行情绪判断，根据自己的认知选择文本是正向、中性还是负面。
该结算两分一条，以10条为结算单位，哀求精确率100%。

图源：京东微工

数据采集一样平常为音频、图片、视频方面的采集，周舟热衷于做数字采集方面的事情，2019年高中毕业后，他开始考试测验这方面的兼职事情。
两年的韶光，他陆陆续续赚了3000多。
“我也没有每天去看，阿里众包在年终、年初、年底的任务很多。
”

在每个任务里，都有明确的哀求，周舟认为这样很明确，可以很快地分辨哪些好做哪些不好做。

图源：阿里众包

比较于数据标注、采集方面的事情，数据转写的门槛轻微高些。
所谓的数据转写，紧张是各种措辞转译事情，比如，在有道众包的少儿英语段音频转写里，哀求口误重复、语法缺点等如实转写，这对付答题者的英语水平哀求不低。

图源：有道众包

为了确保用户所提交产品的质量，除了在提交内容上有所哀求，在用户提交前也有所培训。
在腾讯搜活帮里须要首先进行考试，考试通过后方能进行答题。
周舟曾经做过这类型的考题，做完20道题，精确11道，他得出了却论——裸考必挂。

李元参加这种考试，也没有一次就过的情形，“这种题目须要耐心和比较细腻的语感，而我是那种粗枝大叶的人，而且多次失落败之后带来的挫败感太糟糕了。
”

图源：腾讯搜活帮

等平台发任务——做任务——等平台审核是这类众包软件利用的常规流程，而在这些流程里有任何一个环节脱节，都会带来不好的用户体验。

下载软件创造无任务可做，做任务时创造门槛过高，任务完成创造审核太久，审核后创造精确率不合格……在这条任务链里，用户会遭遇各样的问题，有网友在五个任务都审核失落败后发文称“费力不谄媚。
”

部分平台审核不合格后，价格会打折扣。
但还是有人赚到钱了，在有道众包的3月酬劳排行榜上，第一名酬劳1945.99元。
周舟对付自己两年多攒的3000多元表示满意，“由于目前还是在校生，没有事情。
”

“一小时10元吧。
”何信评估了一下做众包事情的均匀报酬。

二、用户下沉，也在内卷

兼职众包的平台用户，有一种团队化的趋势。

就目前市情上的众包产品来看，任务很多是不定期推送的，新用户注册后平台上有可能面临无任务可领的情形，而相较于加公会做团队而言，普通用户赚的钱是很少的。

而这份事情的主力，互联网巨子们可能也并没有瞄准客户真个普通用户。
据何信理解，向他这样做团队接项目的同行有不少，在平台生动着的也有很大部分是像他们这样的团队。

比较于单独个人当兼职做，团队化随意马虎的多。
价格在近些年也有了不小的变革，以前价格很贵，现在的价格越来越低，由此带来用户的不断往下沉淀。
何信表示用户下沉是要找便宜的劳动力。

2016旁边，那时候做数据标注的人还不是很多，何信说那时候价格是目前两到三倍，画一个框大概七八分钱。
“以前做的人少就挣钱，现在做的人多了就不值钱了，就这个意思。
”兼职众包的用户们，也在不可避免地遭遇内卷。

在何信团队里，一个成熟的员工一小时能画600个框，按照一个框3分的标准，能赚18元。
“但是这个价格是我完备不赢利。
”何信说。
而3分的价格在面向用户的平台里很少涌现，在用户平年夜驾三分的价格算是很高的。
何信找的熟人先容做项目，一样平常接一个项目几千上万的量，然后做上一个月。

这个行业流动性很大，重复性劳动和越来越低的价格让很多人止步于此。
何信的团队不算大，上个月还是五六个人。
来的员工一样平常都是学生，兼职在做这份事情。
五六个兼职的同学才能留下一个，何信对自己团队流动习以为常。

“一开始不熟习业务，做不了那么快，险些就赚不了什么钱，完备看自己做的数量。
”何信阐明团队流动大的缘故原由。

除了数据标注，何信的团队也做过涉及语音转义、数据采集等方面的事情，两三岁孩童的语音、粤语、陕西话的转义他们都做过。
语音转义一样平常来说三分钟能给到七块旁边，数据采集事情相对来说赚的更多，但过于费时费力，这块业务也逐步搁下了。

“车道线、车、人脸，人体……”何信做的数据标注类目有很多，但都是二维的。
数据标注的同行们有的在做三维标注，这样的事情日薪能达300元旁边。

图源：百度众测

但这样的薪资并不是普遍化的，大略重复性的二维图片数据标注事情薪资并没那么可不雅观。

小作坊的涌现，是数据标注团队的一个大趋势。
何信对付这份事情的人有大概的画像。
在城乡结合部，或者村落庄小作坊，有那么一批人，二三十岁，学历不是很高，就在县城做这样的事情。
而很多人也有投资这种数据小作坊的打算。

“我就形容它是网络时期的那种手事情坊。
”何信对这种城乡结合部的小作坊下了一个定义。

“网络时期的民工？”

“完备便是民工了，这不是调侃。
”

三、互联网大厂，为什么须要人兼职演习AI

“演习AI啊。
”

何信很明确的知道自己所做的事情，电子信息工程专业的李元也知道这份事情的意义，“平台给你供应的题目相称于是一个演习的样本。
所有你做的题目便是AI的演习集，它会通过人类的这种思维判断去演习AI。
”

“能知道的只有他（平台）见告我的。
详细数据去哪了，用于什么了，没有去穷究。
”周舟只知道平台奉告的信息，在阿里众包的一个任务中显示，您接管的任务中涉及对个人信息的网络，任务发布者承诺在此任务中网络到的个人信息将会用于“算法演习——牙齿病种识别”的目的，并仅限于任务发布者利用，并不向任何第三方转让、共享以及表露，匿名化或去标识化的除外。

图源：阿里众包

“我们要教机器认识一个苹果，你直接给它一张苹果的图片，它是完备不知道这是个什么东西的，须要现有苹果的图片，上面标注着“苹果”两个字，然后机器通过学习了大量的这类图片，才能认识苹果，个中将图片表示为“苹果”的事情便是数据标注。
”

腾讯搜活帮用上述例子，解释了数据标注的意义。
数据标注员的事情便是在教机器学习。

人工智能包含着机器学习，而监督学习是机器学习的一种演习办法，普通来讲，是要给机器一种标准答案来不断进行演习，以此来达到人类一些识别认知的能力，这也是深度学习的一个目标。

深度学习的成功所依赖的既不是算法，也不是打算能力，而是演习和验证数据的可用性，这些数据终极是通过人的参与得到的。
这是一个非常重复性的劳动，由于机器学习须要大量的样本，大量的样本是由无数重复性劳动所造就的。

而这种重复性劳动在很早之前就有了。
2003年，一款“ESP游戏”就用了这种劳动，它的目的是通过互联网上人们的自由参与来得到描述图像的标签。

在一个游戏中，两个玩家在屏幕上看到相同的图像，并被提示输入描述该图像的关键字。
他们看不到对方正在键入什么，但如果两人输入相同的关键字足够快（“匹配”），他们就会得到分数。
实际上，这些关键字可以用作图像的精确标签。
“ESP游戏”后来被谷歌收购，被称为谷歌图像标签。

不止人工的重复性劳动，验证码也是演习机器的一种办法。
验证码本身是在人机交互中构建，以验证用户实际上是“人工用户”的工具。

reCAPTCHA公司扩展了这一原则，将人类用户的反应重新用作工业深度学习项目的培训数据。
为此，用户须要办理一个小任务，如图像识别或文本识别，这对人类来说是一个低的障碍，但对打算机机器人来说是一个高的障碍。
而reCAPTCHA也被谷歌收购了。

科技自媒体“品玩”曾宣布过类似的征象，验证码越来越有内容，比如标注门牌路牌，让用户帮分类数据库等。
“品玩”也指出在 reCAPTCHA 官网上，Google 公开解释了 reCAPTCHA 集众人之力标注数据，演习 AI 的“众包”模式。

网络中识别图片的验证码

捕获人类的认知的办法已经不再局限于众包中的重复性劳动，将人类的认知嵌入到打算机网络中，让人和机器的关系更加密切，而这种隐性的认知捕获在互联网的各个角落都在发生着。
在重复性劳动不断减少确当下，何信准备钻营新的出路。
他的同行朋友们已经开始在做大略的数据AI，让大略型的数据标注事情交给机器来操作。

用机器做出来的演习集来演习机器，是一个故意思的事情。

在城乡结合部，一批二三十岁的人正在批量生产着AI演习集，重复是他们事情的常态。
也正是由于如此，事情呆板、报酬微薄，充斥着“演习AI”任务的众包兼职平台相称乏味，劝退了不少被兼职平台大厂背景所吸引的用户。

而随着AI和机器的不断自我演习和进化，AI演习AI就在不远的未来，这类平台的未来可能性将会更小。

备注：以上何信、李元、周舟均为化名

参考资料：《Human-aided artificial intelligence: Or, how to run large computations in human brains? Toward a media sociology of machine learning》，Rainer Mühlhoff

作者：刘鑫，编辑：园长；"大众号：刺猬公社（ID：ciweigongshe）

原文链接：https://mp.weixin.qq.com/s/WzBGk2TMEQp69yJtMG8wQA

本文由 @刺猬公社授权发布于大家都是产品经理，未经容许，禁止转载

题图来自 unsplash，基于 CC0 协议

每期AI知识网

我在大年夜厂演习AI用鼠标拉框一次赚3分钱

潮州SEO服务助力企业在线腾飞的秘密武器

潮州SEO营销挖掘地域特色，助力企业腾飞