专栏首页曼孚科技数据标注,人工智能产业落地的坚实后盾

数据标注,人工智能产业落地的坚实后盾

​近几年,人工智能逐渐从理论科学落地到现实中。

大到火车站的人脸识别,小到手机里的语音助手,人工智能与生活越来越息息相关。

然而,随着人工智能应用场景的逐渐增多,人工智能出错的情形也开始频频出现。

近日,丰巢智能柜的刷脸取件就出现了被小学生破解的情况。据央视财经报道,浙江某学校的小学生在课外实验中发现,只要用一张打印照片就能代替真人刷脸,从丰巢智能柜中取走父母的货件。

对此,丰巢回应称,该“刷脸”应用为试运营版本,已在第一时间下线。

不过,公众显然并不认同这种说辞,结合此前董明珠“闯红灯”的乌龙事件,一时间关于“人脸识别技术的安全性与实用性”话题再次成为社会关注的焦点。

△董明珠被“闯红灯”。实际是公交巴士贴着董明珠头像,刚好被摄像头拍到,人工智能系统误以为是董明珠闯了红灯。

很显然,类似情况的出现表明了人工智能在落地的过程中并不是一帆风顺,那我们不禁要问:是什么原因导致了人工智能在落地的过程中频繁出错,我们又该如何解决呢?

1.制约人工智能发展的关键因素

随着深度学习和神经网络的挖掘,越来越多的人工智能技术被应用到日常的生活中,人工智能开始从一个概念性的名词,渐渐地转变成为了能够实现商业化推广的落地应用技术。

在人工智能脱离实验室走向实际场景的这一过程中,数据服务行业逐渐从幕后走到台前,成为这一过程之中最隐秘的见证者。

事实上,数据服务行业在此前的被重视程度是远远不如算法、算力领域的,甚至有一种论调认为:“非监督式学习,闭环学习等等无需大量数据就可以达到同样效果的方式才是人工智能学习的未来。”

然而,事实真的如此吗?举个简单的例子:“几年以前,标注员只需要在人脸上标注几个点就可以了,但是现在面部关键点标注需要206点:每个眉毛上8个,嘴唇个20多个,脸颊17个等等,对于标注数据的精确度也提高到了一个新的要求。”

目前,国内外很多专家学者都表示就当下人工智能的发展阶段,数据数量和数据质量能够直接决定人工智能在识别结果上面的优劣。数据,显然已成为制约人工智能发展的关键一环。

2.何为数据标注

在了解数据标注之前,我们需要明白一个准则:在通常情况下,人工投喂数据的质量往往直接影响着智能的精度。那么,人工投喂的数据从何而来?答案是:数据标注。

简单来说,数据标注是通过数据标注员借助标注工具,对人工智能学习数据进行加工的一种行为。数据标注有很多类型,如分类、画框、注释、标记等等。

可以说,数据是人工智能的基础,而数据标注则是人工智能落地的坚实后盾。

3.数据标注进入精细化时代

长久以来,数据标注行业被外界认为是人工智能金字塔上最底层的工作。此前,经常有报道称某某人工智能公司把数据标注的服务外包给非洲公司,甚至有媒体在探访非洲数据标注工厂后感叹:“贫民在为硅谷人工智能打工赚钱。”

不过,随着当下人工智能行业对于标注数据质量要求的越来越高,数据标注行业逐渐迈向精细化时代。小到用数据爬虫抓取互联网现存数据,并进行拉框,大到根据用户定制化的硬件以及场景需求,去完成数据的采集与多维度数据标注。

数据标注行业,如今正朝着专业化、细分化、场景化的方向不断演进。

行业需求的变化,也催生了业内企业的优胜劣汰。一个最简单的例子就是,如果是人脸检测,那么利用拉框标记就可以很快满足需求。但随着专业人工智能公司要求的提升,人工智能已经不再仅仅是做人脸检测,而是视线追踪、或是微表情检测等。

很显然,这类需求很难通过互联网或者众包用户采集完成。理念更先进、技术更硬核、服务更专业的人工智能数据服务企业才更加符合人工智能行业精细化运营时代的需求。话句话说,高质、精准的数据才是人工智能行业的未来。

专业数据公司对于数据服务行业的预测也完全符合这种观点。

据艾瑞咨询最新报告显示,2018年中国人工智能基础数据服务市场规模为25.86亿元,其中数据资源精准定制服务占比86.2%,行业年复合增长率为23.5%,预计2025年市场规模将突破110亿元。

很明显,数据服务行业未来更加欢迎高质量的数据服务企业,数据标注将脱离刀耕火种,进入精细化运营时代。在数据标注这片蓝海市场中,未来机遇广阔,淘汰也在持续进行,但可以肯定的是专业化、场景化、定制化将成为行业未来发展的主要趋势,构筑起数据服务行业新的未来。

原文链接:https://mp.weixin.qq.com/s/hDJk2v0lF1fdABR1Qf6QIQ

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 三分钟读懂何为“数据标注”

    ​然而,相比于算法与算力,数据领域受到的关注度显然少了很多。尤其是数据标注行业,作为人工智能产业的基石,与处在聚光灯下的AI整体行业相比,显得那么粗砺与拙朴。

    曼孚科技
  • 数据标注,自动驾驶汽车的新“引擎”

    伴随着计算机视觉技术的日臻成熟,出行生态不断智能化,这其中典型的应用场景就是汽车自动驾驶。

    曼孚科技
  • 7种常用的数据标注工具

    标注工具是数据标注行业的基础,一款好用的标注工具是提升标注效率与产出高质量标注数据的关键。

    曼孚科技
  • 【AI的正面与侧面】披着光鲜的外衣的“数据民工”

    像是一场明星演唱会,舞台上灯光华美,主角激情澎湃,粉丝呐喊欢呼,场面一片火爆,而幕后忙忙碌碌的那些人,who cares,人工智能行业大抵如此。繁荣光鲜的背后,...

    钱塘数据
  • TalkingData崔晓波:人工智能的发展离不开大数据的支持

    今年3月9日-15日,在韩国首尔进行的韩国围棋九段棋手李世石与人工智能围棋程序“阿尔法围棋”(AlphaGo)之间的比赛吸引了全人类的关注。3月12日,作为业余...

    BestSDK
  • 华为内部狂转好文,有关大数据,看这一篇就够了!

    【导读】科技的进步在很多的时候总会超出我们的想象,试想如果未来我们一个人拥有的电脑设备超过现在全球现在计算能力的总和,一个人产生的数据量超过现在全球数据量的总和...

    用户1756920
  • 未来二十年,产业变革的核心是什么?

    Giiso小智100%原创哦! 因为人口众多的因素,中国和印度在过去的二十年里一直是整个世界的“代工厂”,但随着科技的进步,经济的发展对劳动力的依赖越来越低,而...

    企鹅号小编
  • 大数据是把万能钥匙,就看你想打开什么样的“宝盒”

    中国大数据应用大会的举办地并不是“常规选项”北上深,而是位于中国国家战略“一带一路”节点之上的四川成都。在过着“安逸巴适”的生活的同时,四川已经拥有了各类产业园...

    BestSDK
  • 从3D人脸到自动驾驶,CVPR2020十个顶级开源数据集

    CVPR2020上开源的十个最有用的数据集,用数据来构建更好的人工智能,数据搬运工从来不应该缺席!下面就是十个数据集的分别解释:

    OpenCV学堂
  • 六禾创投合伙人杜挺:大数据进入快速发展期,企业服务类项目最受欢迎

    数据猿导读 大数据产业仍在初级阶段,商用价值仍未完整展现,市场前景一片广阔。企业服务超过电子商务,成为国内投融资数量排名第一的行业,未来有望持续的做大做强。 ?...

    数据猿

扫码关注云+社区

领取腾讯云代金券