人工智能的未来在于数据

据美国著名杂志《连线》(WIRED)网站2015年11月报道,Google开源机器学习系统TensorFlow表明人工智能的未来依赖于数据,而不是软件。

Google在11月宣布开放其人工智能搜索引擎的源代码,CrowdFlower的创始人兼首席执行官Lukas Biewald认为这不是免费软件运动的胜利,而是数据的胜利。他认为当谈到人工智能时,真正的价值不在于软件或算法,而在于使它变得更加聪明所需要的数据。

(1)让机器更加聪明

TensorFlow是一种基于深度学习的人工智能系统。通过将数据输入到巨大神经网络连接的机器中,可以让系统执行任务,如辨别图片、识别口语词汇和理解自然语言。如果将猫的图片输入到神经网络中,可以教会系统识别猫;如果将对话数据输入到机器中,可以教会系统进行对话。

驱动这些神经网络的算法并不是新鲜的,它们可以追溯到二十世纪八十年代。新颖的是,由于互联网的存在,运行这些算法所需要的处理能力和海量数据已变得可获取。为了教会系统辨别一只猫,需要大量的机器和大量的猫的图片。

云计算兴起以后,可以向像Amazon和Microsoft这样的公司租用巨大的处理能力,人们都可以访问巨大的机器阵列。但像Google和Facebook这样的大公司却拥有最富有的数据。通过数十亿用户使用他们的服务,他们可以获得富有的信息宝库,如文字、图片、视频和语音。两家公司都在努力地建构强大的人工智能软件,但是他们真正的竞争优势来自于掌握大量高质量的数据,可以使用这些数据教会软件像人类一样“思考”。

(2)人才需要数据

虽然Google已经开源其人工智能引擎非常重要的一部分,但是至少到现在它还保留了另外一部分。在竞争环境中,人才是至关重要的。虽然驱动这种技术的算法是陈旧的,但是它们在以快速的步伐演变,并进入到越来越多的领域;同时这种演变是被一些非常聪明的人所驱使。这是Google公司开源TensorFlow的一个原因。如果公司以外的人可以使用它的软件,Google可以更加容易地把人才纳入到公司。

还有另一个原因,Google可以吸引顶尖的深度学习研究人员:它的数据。这对Facebook和其他互联网巨头也是同样如此的。近些年,机器学习领域的许多顶级研究人员已经加入这些公司,包括加拿大多伦多大学教授Geoff Hinton(现就职Google公司),美国纽约大学教授Yann Lecun(现就职Facebook公司)和斯坦福大学教授Andrew Ng(现就职百度公司)。

Biedwald认为如果从事学术研究,人们不能获得这样丰富的数据。对于学术界和创业公司来说,做真正有意义的机器学习工作是很难的。因为他们不能接触到Goolge或Apple相同种类的数据集。Apple公司通过服务产生了大量的数据,但科研人员认为Apple可能处于劣势,因为站在隐私的立场上,它严格限制工程师使用数据。但像Google和其他公司一样,Apple不仅已经并购了深度学习初创公司,还吸引了人工智能方面的人才。但毋庸置疑的是,人工智能的未来不能没有数据。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2015-12-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏罗超频道

如何让搜索引擎拥有“生命”?

在许多人看来搜索引擎只是一个检索工具,就像其他冷冰冰的科技产品一样。实际上,搜索引擎正在成为人人依赖的智能助手。它在拥有感知环境和自我学习的能力后,随着岁月流逝...

3745
来自专栏罗超频道

多媒体搜索再进化

2015年百度世界展出了语音和图像为代表的多媒体搜索技术,这并非其首次亮相百度世界大会,多媒体搜索已成为百度的重头戏,与连接人与服务战略、人工智能战略一起构成百...

3348
来自专栏AI科技评论

阿里巴巴司罗畅谈自然语言智能技术,两平台四应用助力商业落地

在感知智能、认知智能和创造智能之下,我们一定要解决「更好地理解知识,更好地分析语义」的工作,这就是自然语言处理所肩负的重要技术使命。

904
来自专栏西安软件开发

大数据应用技术学习不应做盲人摸象,闭门造车的实验室派

随着科技的高速发展,数据在人类生活和决策中所占的比重越来越大,大数据的兴起只是说明了一种现象,面对如此广度和深度的大数据技术栈和工具集,如何学习和掌握好大数据分...

684
来自专栏大数据和云计算技术

交互式分析技术

机器学习和数据挖掘是个非常难的领域,所以在这个领域有数据科学家这么一个职位。“数据科学家”在2009年由Natahn Yau首次提出,其概念是采用科学方法、运用...

3416
来自专栏云加新鲜事儿

构建一站式机器学习服务平台,腾讯云为AI实现更多可能

5月24日,以“无界数据 无限智能”为主题的腾讯“云+未来”峰会AI大数据分论坛在广州拉开帷幕。此次分论坛上,腾讯云针对AI大数据技术的实现与应用,正式对外公布...

3187
来自专栏PPV课数据科学社区

【探讨】你仅仅是个数据工具使用者吗?

有时候会听到有人说:「我终于学会用R了」,「我终于学会用SAS了」...... 高兴之余,我不免要说,这可能有点伪命题的意思。R、SAS、Excel等等都只是工...

2698
来自专栏腾讯技术工程官方号的专栏

腾讯俞栋:定义下一代智能人机交互,从目标、挑战到实现路径

语音识别及深度学习领域专家、腾讯AI Lab副主任及西雅图实验室负责人俞栋博士,在2018年腾讯全球合作伙伴大会上展示了腾讯AI正在推进的跨领域前沿研究:下一代...

542
来自专栏灯塔大数据

TA是什么“鬼”?一个优秀数据科学家的主要构成特点

? 根据三位作者的咨询和研究经验,以及与许多大数据和分析主题的公司合作,了解一个良好的数据科学家具有哪些主要特征。 大数据分析已经满天都是,IBM项目,每天...

2739
来自专栏专知

科技部-科技创新 2030—“新一代人工智能”重大项目 2018 年度项目申报指南征求意见稿

根据《国务院关于改进加强中央财政科研项目和资金管理的若干意见》(国发〔2014〕11号)、《国务院关于深化中央财政科技计划(专项、基金等)管理改革方案的通知》(...

771

扫码关注云+社区