没有大数据就没有人工智能?

自从 Google 的人工智能 AlphaGO 成为围棋界的百胜将军开始,AI(Artificial Intelligence,人工智能)这两个英文字,刹那间成为科技业最热门的关键字之一。而就在2017年初,早在 AI 领域打下深厚底子的 IBM Watson,除了打进一些数据服务公司、科技公司外,甚至进军医疗领域,能够依照病患资料判定青光眼,准确率高达95%。

我们现在已经迈入了AI与机器人逐渐取代人类工作的年代,在不知不觉间,AI的相关技术已经开始渗透每个人生活的角落,从Google与Facebook依照兴趣投放的广告、可以帮你找资料设定日历的语音助理Siri,背后都含有AI的概念与技术。未来的生活无论是投资、交通、医疗、学习、生产,将无处不是AI的踪影,这个技术也将彻底改变人们的生活模式。

是什么让AI从“科幻”变“科技”?

AI其实是个庞大而复杂的概念,但大都奠基于一项基础的关键技术,这个技术叫做“机器学习 Machine Learning”。

机器学习技术,就是让机械拥有自主学习的能力,说起来很简单,但在1950年代技术萌芽期间,演算法和硬体条件都不够成熟,是直到近年来日益优异的演算法,与强劲的硬体运算能力,才让机器学习的能力有突破性进展,而其中带进展最为快速的一项关键技术,就是大家最耳熟能详的──“深度学习”。

我们来看看这个数据:2015年机器学习的周边市场规模约3.6亿美元,至2020年预估将突破29亿美元,并在AI整体市场的50亿美元中占了约六成比重,可以说机器学习的技术突破,就是AI市场发展的原动力。

既然机器学习重要,那么它究竟是什么?为何能进展神速?

“大数据”提高了深度学习精准度

演算法及硬件条件的大幅跃进提供了机器学习发展的优良条件,再加上数字化联网的蓬勃下带来的“大数据”,便引爆了科技大厂争相投入深度学习技术的浪潮。目前不管是NVIDIA这类的芯片商,或擅长演算法的Google、Facebook等软件商,最常提到从事的机器学习的主流技术,就是深度学习。

举个例子描述深度学习如何进行。想像一下,要让一台搭载深度学习能力的车辆进行自动驾驶,面对陌生的路线、随时有行人冲出马路的危险路况,机器怎么判断?透过深度学习,你可先一次提供机器海量的数据资讯,包含路标、号志、路树、行人、等,让它学会辨识环境中的物体为何,学会了,便有助于它在行进过程中快速而精准地避开障碍、找出最佳路径,并顺利抵达目的地。只要数据越丰富完整,机器就越能够提高一切辨识的精准度,以加强判断能力。

这么说来,要能让AI靠“深度学习”发展思考能力,很大程度是依赖大数据所赐,不过,这时候我们就会面临一个问题:没有大数据,深度学习就毫无用武之地了吗?

“小数据”的机器学习方案也蓄势待发

大数据带给深度学习强而有力的判断能力,但其实机器若要做到“学习”这件事,深度学习并不是唯一方法。

回到自动驾驶的例子,倘若这次我们先不将海量的数据提供给机器,而是只告诉他“目的地”、“禁止碰撞”两项指令,然后任凭他不断的Trial & Error,在失败中汲取“经验”以达到学习的效果,最终也能抵达目的地(前提当然是没有遭遇严重车祸影响行进能力)。这样在初始阶段不仰赖大数据的学习方式,可以归类为“强化学习”。

强化学习的方法能补足机器在突发状况下的应变能力,AlphaGO 的开发商 DeepMind 也深谙这项方法的优点,因此让 AlphaGO 也借着深度学习与强化学习的组合,在对手下出意料之外的棋步时,随即建立新的经验,以做为未来在相同局势下能克敌制胜的判断依据。

为什么我们需要“小数据”的 AI 培养方案?

事实上,“获取足够大量的数据”就是极耗成本的一件事,此外,有些数据如罕见疾病的病历、症状等本身就具稀有性,因此像是强化学习等低数据依赖度机器学习方案逐渐开始受到青睐,许多公司与研究机构也以此作为研发的努力方向。日前就有一间名为 Gamalon 的新创公司发表新技术,表示其 AI 系统可仅用很少量的数据训练机器学习,就达到媲美进行深度学习后的精准辨识能力,成功吸引市场关注。

除了一般仰赖大数据的深度学习外,其他可降低数据量依赖度的机器学习方案正不断酝酿中。在不远的未来,我们开车出门只要安稳的在后座休息,不须担心安全与塞车问题,AI 自然会帮我们找到最佳路径;弹指轻点,手机便会帮我们挑选出最适合的购物选择;还可能有贴身的虚拟健康顾问可咨询,并随时告知我们每天的饮食是否均衡、甚至帮我们设计健康菜单。

AI 深入生活的程度,说不定会比我们想像中来得更快。

原文发布于微信公众号 - 钱塘大数据(qtbigdata)

原文发表时间:2017-06-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

从谷歌TPU谈起,人工智能正如何撼动芯片市场

编者按:本文原作者为 Wired 高级作家 Cade Metz。原标题为《How AI Is Shaking Up the Chip Market》。以下为雷锋...

3228
来自专栏企鹅号快讯

斯坦福大学:借助谷歌街景数据,可分析社区人口的收入状况和投票倾向

针对民主党和共和党选区的人们更喜欢轿车还是皮卡这些事,市场研究人员和政治分析师们已经研究了几十年。不过近日,斯坦福大学研究人员们通过一个雄心勃勃的项目 —— 分...

2.6K11
来自专栏iOSDevLog

《超级智能》书评

2017年的此刻,你和世界上的大多数人一样,坐在办公桌前拼命完成上级布置的工作任务,或是无聊地刷着网页打发时间等待下班。你焦虑于本周的工作能否按时做完,公司的年...

871
来自专栏大数据文摘

人类历史上最有影响力的5张信息图

34210
来自专栏SeanCheney的专栏

《数据科学家访谈录》总结·3

01 - 05:DJ Patil, Hillary Mason, Pete Skomoroch, Mike Dewar, Riley Newman 06 - ...

1241
来自专栏前沿科技

中兴智能视觉大数据:未来五年人脸识别市场规模将保持年均25%的增长速度

中兴智能视觉大数据报道:人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸...

2725
来自专栏玉树芝兰

如何选研究题目?

本着一贯的开放原则,我把这篇文章同时发布到网络上。欢迎有需要的高年级本科生或低年级研究生同学一起阅读。

711
来自专栏PPV课数据科学社区

【学习】如何修炼成大数据高手?推荐你看这些书

首先声明一点,千万不要以为看了这篇文章就能成为大数据高手了,不然就不会用“修炼”这个词了,要修炼成大数据高手决不是件容易的事,可以说是非常 难的一...

2834
来自专栏AI科技大本营的专栏

古代荀子也懂AI?达芬奇的手术机器人有多神奇? 听浙大吴飞扒一扒人工智能的“古今中外”!

整理 | 晶晶 西周的印纸造文、三国的木牛流马、希腊古城的黄金机器女仆……吴飞的演讲,一下子将人工智能的历史拉到了2000年前……原来用机器替代劳动的想法古已有...

3805
来自专栏DT数据侠

2万条评论数据带你揭秘“菊粉军团”真实面目

最近,创造101很火。但比节目更火的是全民pick的菊姐!王菊体型微胖,皮肤黝黑,和传统选秀偶像相去甚远。但她有想法、不服输的性格却受到了广大观众的喜爱。菊姐从...

1000

扫码关注云+社区