如何确保A.I.营养充足

人工智能就像孩子一样,需要合适的教育来激发他们的潜能,也需要合适健康的饮食——高质量的数据。

业务的快速增长亟需人工智能加快判断能力,但是在人工智能的黑盒子里,要考虑的东西很多。人工智能所做出决策的质量和数据质量息息相关。有一句老生常谈的话——“废料只能出废品”,对人工智能来说再合适不过。

为什么呢?比较一下下面两种方式的区别就知道了。一般的分析方案会提供一个特定顺序的结果关系图表。如果你问一个分析程序,为什么北方的销售业绩变差了,你就会得到一系列可能因素的列表:供应链问题、人口变动、社会媒体倾向等。然后需要人工评估这些结果,最后确定到底是哪一个因素。而人工智能给出的答案将会更直白,如果你问人工智能这个问题,你将会得到唯一一个确定的答案。就这样,非常简单。

人工智能的方法将会实现很多商业用户的梦想:问一个问题,得到一个确定的答案,然后自信地采取下一步行动。这将会节省时间,带来更快速、更优秀的商业决策。

但如果人工智能是错误的呢?更重要的是,商业用户如何才能知道人工智能出错了?因为这个原因,依赖人工智能要比依赖分析方案付出更多的信任。对首席数据官或数据科学家来说,训练一个人工智能是莫大的责任。

用来训练人工智能的数据必须要干净、有相关性、可追溯数据来源。人工智能要保持“膳食平衡”,需要满足一下几点:

确定范围

人工智能不能喝掉一个数据湖里面所有的水,这些数据是未经清理、打包和结构化的。根据CGOC(Compliance, Governance and Oversight Counsel),公司产生的数据中,有将近70%是没有业务关系、没有价值的,所以你必须开发一种方式,来理解和确定数据的范围,和人工智能所能接受的数据标准。使用什么样的数据?什么样的类型?数据之间有什么样的联系?谁来为决定负责?

审核并管理资源

一旦确定了数据资源,你就需要确保数据的质量。为了提高人工智能的可靠性,你需要了解数据的可靠度、真实性和内容对数据集合的贡献。这些可以通过热图和可视化完成。

因为数据通常都是由多个资源复制过来的,数据科学家和项目专家必须有一系列的处理过程,包括确定数据位置、审核和跟踪。

标记和分类

你需要对数据进行标记和分类,以确保数据可以被正确地理解。由于人工智能的特殊性,元数据比其他数据更有价值。如果你在关注市场数据,那么你得到的元数据会包括社交媒体网站的图片、物理位置、时间戳、相机类型和一系列数字。在医疗方面,元数据包括病人的身份证生日、数据时间戳和必要的隐私内容。

跟踪反应和更新

最后,你必须有控制系统的能力,能跟踪使用信息并据此进行更新。

对人工智能莫大的讽刺是,这看起来是一项完全自主的计算过程,是数据自我处理的一个过程。实则需要人类在某一特定方面的知识来训练人工智能。只有认识到人类工作的重要性,才能让人工智能作出正确的决策,避免过度自信。作为“父母”,我们必须不断的、有耐心地训练人工智能,直到他们能非常优秀地满足我们的需求。

原文发布于微信公众号 - CSDN技术头条(CSDN_Tech)

原文发表时间:2016-07-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云计算D1net

展望云计算:2018年四个获得数据支持的预测

22740
来自专栏互联网数据官iCDO

送给求职者5个打造个人品牌的建议

老实说!找工作从来都不是一件容易的事,如果你不知道如何向雇主推销自己的个人品牌,那对你来说会是个极大的挑战。那些认识到个人品牌打造技巧重要性的人心里一定清楚这是...

12130
来自专栏数据猿

投稿 | 互联网数据化运营管理-流量篇

互联网的商业模式千变万化,但其盈利模式目前大抵可以分为以下三种:一是向用户出售商品或服务,其中电商和o2o就属这种模式;二是靠广告来进行盈利,典型的例如goog...

28050
来自专栏数据的力量

独家资料分享《知识管理快速入门》

我第一次接触知识管理的概念,是在田志刚老师(中国知识管理研究第一人)的培训中,从此关注如何提升个人的知识管理水平。经过五、六年的实践,逐渐形成一套符合...

17210
来自专栏BestSDK

物联网智能时代的风口——边缘计算

什么是边缘计算? 为了定义的缘故,当边缘服务器是指内容传送网络(CDN)中的服务器的术语时,广义的边缘计算似乎起源于近20年前。它最近出现在处理,分析和应用网络...

31540
来自专栏新智元

【英伟达要担心亚马逊造 AI 芯片吗?】谷歌、苹果、微软、亚马逊AI芯片对比

新智元编译 来源:fool.com 编译:Marvin 【新智元导读】凭借GPU,英伟达公司一直是AI趋势的最大受益者之一。但随着科技巨头纷纷研发自己的...

35990
来自专栏腾讯研究院的专栏

大数据:全新机遇还是一纸空谈?

  目前,人们对大数据及其价值的认知各有不同。一部分人认为大数据的价值在于帮助企业各部门获得新的洞察力并付诸行动;另一部分人认为大数据不过是天花乱坠的宣传而已...

22480
来自专栏云计算D1net

企业如何构建策略应对多云安全的三大挑战

安全专家表示,随着多云环境的发展,已经推出了许多安全实践,并且组织在制定自己的安全策略时都应采取一些关键步骤。数据泄露或入侵者警报将使组织安全团队高度紧张,因为...

9020
来自专栏CSDN技术头条

BDTC 2014|Apache软件基金会主席Doug Cutting:The Data Revolution

【CSDN现场报道】2014年12月12-14日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中科院计算所与CSDN共同协办,以推进大数据科研、...

19960
来自专栏ThoughtWorks

银行移动产品从团队敏捷走向产品敏捷 | 洞见

中国银行业的数字化转型刚刚拉开帷幕,移动产品成为了中国银行业的新战场。为在新战场占有一席之地,各家银行开始纷纷尝试自己移动产品的敏捷转型,更有甚者开始重新组建I...

11630

扫码关注云+社区

领取腾讯云代金券