人工智能的未来在于数据

据美国著名杂志《连线》(WIRED)网站2015年11月报道,Google开源机器学习系统TensorFlow表明人工智能的未来依赖于数据,而不是软件。

Google在11月宣布开放其人工智能搜索引擎的源代码,CrowdFlower的创始人兼首席执行官Lukas Biewald认为这不是免费软件运动的胜利,而是数据的胜利。他认为当谈到人工智能时,真正的价值不在于软件或算法,而在于使它变得更加聪明所需要的数据。

(1)让机器更加聪明

TensorFlow是一种基于深度学习的人工智能系统。通过将数据输入到巨大神经网络连接的机器中,可以让系统执行任务,如辨别图片、识别口语词汇和理解自然语言。如果将猫的图片输入到神经网络中,可以教会系统识别猫;如果将对话数据输入到机器中,可以教会系统进行对话。

驱动这些神经网络的算法并不是新鲜的,它们可以追溯到二十世纪八十年代。新颖的是,由于互联网的存在,运行这些算法所需要的处理能力和海量数据已变得可获取。为了教会系统辨别一只猫,需要大量的机器和大量的猫的图片。

云计算兴起以后,可以向像Amazon和Microsoft这样的公司租用巨大的处理能力,人们都可以访问巨大的机器阵列。但像Google和Facebook这样的大公司却拥有最富有的数据。通过数十亿用户使用他们的服务,他们可以获得富有的信息宝库,如文字、图片、视频和语音。两家公司都在努力地建构强大的人工智能软件,但是他们真正的竞争优势来自于掌握大量高质量的数据,可以使用这些数据教会软件像人类一样“思考”。

(2)人才需要数据

虽然Google已经开源其人工智能引擎非常重要的一部分,但是至少到现在它还保留了另外一部分。在竞争环境中,人才是至关重要的。虽然驱动这种技术的算法是陈旧的,但是它们在以快速的步伐演变,并进入到越来越多的领域;同时这种演变是被一些非常聪明的人所驱使。这是Google公司开源TensorFlow的一个原因。如果公司以外的人可以使用它的软件,Google可以更加容易地把人才纳入到公司。

还有另一个原因,Google可以吸引顶尖的深度学习研究人员:它的数据。这对Facebook和其他互联网巨头也是同样如此的。近些年,机器学习领域的许多顶级研究人员已经加入这些公司,包括加拿大多伦多大学教授Geoff Hinton(现就职Google公司),美国纽约大学教授Yann Lecun(现就职Facebook公司)和斯坦福大学教授Andrew Ng(现就职百度公司)。

Biedwald认为如果从事学术研究,人们不能获得这样丰富的数据。对于学术界和创业公司来说,做真正有意义的机器学习工作是很难的。因为他们不能接触到Goolge或Apple相同种类的数据集。Apple公司通过服务产生了大量的数据,但科研人员认为Apple可能处于劣势,因为站在隐私的立场上,它严格限制工程师使用数据。但像Google和其他公司一样,Apple不仅已经并购了深度学习初创公司,还吸引了人工智能方面的人才。但毋庸置疑的是,人工智能的未来不能没有数据。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2015-12-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

【重磅】《人工智能标准化白皮书(2018)》发布(完整版)(附下载链接)

【导读】1月18日,召开国家人工智能标准化总体组、专家咨询组成立大会,在会上,国家标准化管理委员会宣布成立国家人工智能标准化总体组、专家咨询组,负责全面统筹规划...

4347
来自专栏腾讯研究院的专栏

75.9%受访者发现存在“大数据”滥用现象

电子科技大学互联网科学中心主任、《大数据时代》中文翻译者周涛认为,企业有没有“大数据”能力,分析报告是否包含“大数据”成分,要看是否具备两个特征:一是数据本身...

1835
来自专栏新智元

【未来5年AI应用报告】谷歌、DeepMind、英伟达科学家支招企业AI应用(24P)

来源: reworkco 编辑部 【新智元导读】 ReWork的一份最新AI落地应用报告,阐述了企业该如何使用AI技术。谷歌的Ian GoodFellow、De...

33414
来自专栏新智元

【干货】微软资深研究员展望机器学习10年趋势

【新智元导读】Vowpal Wabbit 的主要开发人员、微软研究院资深研究员John Langford今天在Quora上谈了他对机器学习未来10到30年的展望...

3455
来自专栏腾讯大讲堂的专栏

2017腾讯创新日 | 科技引领潮流,创新打造未来

创新充满挑战,科技提供更多可能,随着社会的不断前进,科技、创新越来越深入我们的工作和生活中。勇于挑战自我、专研业务技术的腾讯人在6.14日举办了2017年“腾讯...

3076
来自专栏大数据文摘

业界 | Teradata全球调研:四分之三企业分析项目数据科学家“缺货”

当地时间10月15日,2018 Teradata全球用户大会在美国拉斯维加斯举行。来自15个国家的3000多位数据人参与了本次峰会。

664
来自专栏镁客网

深思考杨志明:AI赋能行业,云+端双模式落地商业、医疗大健康领域 | 镁客请讲

多模态深度语义理解技术是深思考的核心技术,目前在中文语义理解、多轮人机交互和机器阅读理解方面均取得突破。

814
来自专栏新智元

商汤科技徐立:AI 将在10 年内创造一个印度和中国的总产值

【新智元导读】3月22日,清华大学《人工智能前沿与产业趋势》系列课程第二讲开课,本讲聚焦当前AI领域最火、落地应用最成功的计算机视觉,由商汤科技CEO徐立主讲。...

34212
来自专栏DT数据侠

数据点亮城市:如何玩转时空地理数据可视化

日常出行离不开地图导航,你有没有想过结合地图能做出哪些炫酷的可视化作品?6月22日的数据侠公开课中,来自城市数据团培训教育部的负责人胡颖分享了城市空间数据可视化...

1240
来自专栏镁客网

AI巨头实力排名新鲜出炉:DeepMind第一,IBM垫底

2183

扫码关注云+社区