前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何确保A.I.营养充足

如何确保A.I.营养充足

作者头像
CSDN技术头条
发布2018-02-12 13:12:34
4630
发布2018-02-12 13:12:34
举报
文章被收录于专栏:CSDN技术头条CSDN技术头条

人工智能就像孩子一样,需要合适的教育来激发他们的潜能,也需要合适健康的饮食——高质量的数据。

业务的快速增长亟需人工智能加快判断能力,但是在人工智能的黑盒子里,要考虑的东西很多。人工智能所做出决策的质量和数据质量息息相关。有一句老生常谈的话——“废料只能出废品”,对人工智能来说再合适不过。

为什么呢?比较一下下面两种方式的区别就知道了。一般的分析方案会提供一个特定顺序的结果关系图表。如果你问一个分析程序,为什么北方的销售业绩变差了,你就会得到一系列可能因素的列表:供应链问题、人口变动、社会媒体倾向等。然后需要人工评估这些结果,最后确定到底是哪一个因素。而人工智能给出的答案将会更直白,如果你问人工智能这个问题,你将会得到唯一一个确定的答案。就这样,非常简单。

人工智能的方法将会实现很多商业用户的梦想:问一个问题,得到一个确定的答案,然后自信地采取下一步行动。这将会节省时间,带来更快速、更优秀的商业决策。

但如果人工智能是错误的呢?更重要的是,商业用户如何才能知道人工智能出错了?因为这个原因,依赖人工智能要比依赖分析方案付出更多的信任。对首席数据官或数据科学家来说,训练一个人工智能是莫大的责任。

用来训练人工智能的数据必须要干净、有相关性、可追溯数据来源。人工智能要保持“膳食平衡”,需要满足一下几点:

确定范围

人工智能不能喝掉一个数据湖里面所有的水,这些数据是未经清理、打包和结构化的。根据CGOC(Compliance, Governance and Oversight Counsel),公司产生的数据中,有将近70%是没有业务关系、没有价值的,所以你必须开发一种方式,来理解和确定数据的范围,和人工智能所能接受的数据标准。使用什么样的数据?什么样的类型?数据之间有什么样的联系?谁来为决定负责?

审核并管理资源

一旦确定了数据资源,你就需要确保数据的质量。为了提高人工智能的可靠性,你需要了解数据的可靠度、真实性和内容对数据集合的贡献。这些可以通过热图和可视化完成。

因为数据通常都是由多个资源复制过来的,数据科学家和项目专家必须有一系列的处理过程,包括确定数据位置、审核和跟踪。

标记和分类

你需要对数据进行标记和分类,以确保数据可以被正确地理解。由于人工智能的特殊性,元数据比其他数据更有价值。如果你在关注市场数据,那么你得到的元数据会包括社交媒体网站的图片、物理位置、时间戳、相机类型和一系列数字。在医疗方面,元数据包括病人的身份证生日、数据时间戳和必要的隐私内容。

跟踪反应和更新

最后,你必须有控制系统的能力,能跟踪使用信息并据此进行更新。

对人工智能莫大的讽刺是,这看起来是一项完全自主的计算过程,是数据自我处理的一个过程。实则需要人类在某一特定方面的知识来训练人工智能。只有认识到人类工作的重要性,才能让人工智能作出正确的决策,避免过度自信。作为“父母”,我们必须不断的、有耐心地训练人工智能,直到他们能非常优秀地满足我们的需求。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-07-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CSDN技术头条 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档