首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能背后的“人工”:给AI“编教材”的小镇青年

下乡采集人像的小镇青年

“各位村民注意了,做人像采集,免费领礼品!”

在河南省平顶山郏县的龙头槐村,一阵阵吆喝声打破了夏日的宁静。不一会儿,村民们带着小板凳,三三两两结伴到村头的广场集合。

“头再歪一些,再歪,保持住,微笑。”一个村民在“摄影师”的指导下,慢慢变化表情动作拍摄照片。张嘴、撅嘴、捂脸……在近四十分钟的时间里,“摄影师”一共为这位村民拍摄了100张照片。

“摄影师”名叫赵国首,他是河南千机数据公司的一名数据采集员。这一次,他的任务是带领一个十几个人的团队,在一周内采集到500人的面部照片。

赵国首的团队里都是年轻人,最小的成员今年还不足20岁。尽管这些采集员大多只有中学学历,但这项工作对他们而言并不困难。

公司为每位采集员配备了一部手机、一张采集要求表、一根手机支架。他们只需要严格遵循客户制定的拍摄需求,指导村民们变换表情、调整角度,并拍下照片。

在赵国首看来,采集员就像是“代执行人”,完全被动地执行客户的要求。赵国首介绍:“每个人要拍摄100张照片,每一张照片对表情、光线、背景的要求都不同,所以要完全按照要求来拍摄。”

七月连续的高温天气给户外采集增加了难度,采集团队只能动员公司员工和他们的亲朋好友一起宣传,并通过发放礼品或者支付报酬,来吸引更多的人帮助他们完成工作。

尽管很多村民并不清楚人像采集的用途,大多数人对人工智能也一无所知,但冲着礼品和报酬,村民们往往很乐意配合采集。在这一次的采集中,每位村民在拍摄完100张照片后,拿到了30元的报酬。

未来,这些采集来的数据将被用于美颜相机的系统训练。通过“学习”这些人脸照片,软件可以准确分辨人的面部表情,从而实现“一键美颜”的效果。

为人工智能“编写教材” 的独腿妈妈

训练人工智能,除了人像采集之外,还需要把这些采集来的素材转换成可以供机器学习的教材。在龙头槐村的一处民房里,有一群年轻人在进行数据标注的工作。

魏琳琳坐在电脑前,轻点鼠标,按照顺序标出人体的12个主要关节点位。每个关节都有对应的数字,魏琳琳必须要严格按照顺序准确地进行标注。在人工智能和机器进行算法训练时,魏琳琳的这些操作可以帮助机器准确地识别人体。

除了人体点位的标注之外,魏琳琳的工作还包括通过拉框来标注出人脸或者车辆等。人工智能本身并不会自动识别对象,魏琳琳的工作就是根据不同的场景需求,编写训练机器看图识别的“教材”。经过标注的数据将会被用于智能驾驶、人脸识别、无人超市等智能系统的训练。

每天9小时的工作时间,魏琳琳最“高产”的一天能够标注两千多张图片。无需在外奔波,借助电脑便可完成一切工作,这对身体情况特殊的魏琳琳来说再合适不过了。

三岁的时候,一场车祸夺去了她的左腿。由于身体原因,魏琳琳此前可以选择的工作并不多。很长一段时间内,她一直在一家针织厂上班,每天需要骑半个小时的电动车去工厂,但是一个月工资只有一千多元。

今年,河南一家数据标注公司在龙头槐村的分部开始招工。魏琳琳得到这个消息之后,毫不犹豫就辞去了针织厂的工作。现在,她每天骑电动车只需要几分钟就可以到达工作的地方。这份家门口的工作,给了魏琳琳更多与孩子相处的时间,也为家庭带来了更高的收入。

数字时代的“富士康工人”

“如果人工智能是小孩,算法工程师是老师,那么我们的工作就是根据课堂的需求,来编写教材。”公司负责人刘洋锋如此形容员工们所做的工作。在刘洋峰看来,这份看似简单枯燥的工作,对员工的操作规范有着很高的要求。所有标注好的数据会由专职人员进行审核确认,来确保数据标注的准确率。

2018年3月,刘洋锋和两位合伙人注册成立了这家数据标注公司。仅仅一年的时间,千机数据从不到20人的小团队,快速发展成为拥有数百名员工的“数据工厂”。

在搬进新的办公场地时,刘洋锋把办公室打造成了一个“大型网吧”。他购买了一大批二手沙发,用以取代办公室里常见的椅子。“我们是把标注员当做顾客来对待的,让他们在舒适的环境中愉快地工作。”

刘洋锋坦言,虽然数据标注是人工智能产业的一环,但是也无法回避它作为劳动密集型产业的本质。“大量的劳动力”,是公司生存和发展的核心。

据刘洋锋介绍,目前千机数据在郑州、洛阳、平顶山和许昌都设有分部,公司甚至还把分部开到了乡镇村庄的农家小院里。新兴产业的出现,给县城以及乡镇的年轻人提供了就近工作的机会。他们不必背井离乡,每月就能有三四千元的稳定收入。

近年来,大规模的人力和资本涌入人工智能行业,算法公司呈现出爆发性增长,同时也带动了标注行业的兴起。像千机数据这样的数据标注公司,在河南、河北、重庆等地如雨后春笋般诞生。在这个“数据工厂”内,标注员们日复一日处理着海量的数据,和流水线上重复作业的工人如出一辙,他们也因此被称为数字时代的“富士康工人”。

但是,有业内人士认为,当技术趋于成熟之后,这些新时代的流水线工人将很快面临失业的危机。更有言论称,这些数据处理员所做的工作,正是帮助人工智能在不久的将来取代自己。

对此,刘洋锋坦言,数据标注行业究竟会以怎样的态势发展,自己无法准确预测。但是,就目前的技术而言,数据标注行业短时间内还有很大的生存空间。但面对越来越高端、越来越专业化的人工智能市场,他们需要提前做出准备,尽可能吸引更多的人才,让公司更加专业化。

尽管数据标注的发展前景无法预知,但这个新兴的行业,给这些标注员带来的是与这个时代同频共振的体验。对于赵国首而言,这份工作打开了他认知的新领域:“以我的文化水平,我根本无法深入了解人工智能的概念。但是,这个工作最起码让我了解了很多新鲜事物是怎么产生的。”

“我从小梦想的工作状态,就是像白领一样坐在电脑前办公。现在,看着我们的员工,我感觉那个梦想算是实现了吧。”刘洋锋说。

(看看新闻Knews记者:楚华 李响 实习编辑:王旭)

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190731A0SRRC00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券