首页
学习
活动
专区
工具
TVP
发布

人工智能阿尔法元

《吴军·硅谷来信》20171019《特别来信丨千字解析人工智能阿尔法元》

10 月 19 日,《自然》(Nature)杂志官网上刊登了 Google DeepMind 团队(也就是下围棋的 AlphaGo 背后的技术团队)的大卫·席瓦尔(David Silver)博士的一篇文章,介绍了他们最新的研究成果:不使用人类对弈棋谱,直接采用机器学习(增强学习)的方法,反而能够训练出更厉害的围棋对弈程序,该团队把这个程序称为 AlphaGo Zero(一些媒体将它翻译成“阿尔法元”)。

我们不妨从下面五个方面看待这件事:

1.下棋这件事从本质上讲还是一个计算问题。绝大部分棋类游戏,今天的计算机已经证明先走必胜,比如五子棋。当然,围棋的复杂度很高,大约是10 的 172 次方。

也就是说,如果把宇宙中每一个基本粒子都变成一个宇宙,再把那些宇宙中的基本粒子数一遍,数量也只有围棋棋盘上各种变化总数的一亿分之一(甚至更少)。这个数字在人类看来是无穷大的,但毕竟还是有限。因此,围棋的问题在没有人类知识输入的情况下,靠自己学习,最终有一天会被计算机解决。或许阿尔法元的出现就标志着这一天快要到来了。

2. 人的对局显然产生了很多错误,或者说噪音。

人的认知局限于周围的世界和我们的脑力。相比计算机,人接触的世界非常小,对大数据其实不是很敏感。在这种情况下,人采用的策略,常常不是最好的处理大数据的策略。而计算机则不同,它一开始就是被设计用来处理海量的数据,因此使用的方法完全不同。

人类由于脑力有限,因此几千年来总结的围棋下法只是我们的脑力可以理解的,远非最佳的策略。AlphaGo 在初期使用人类的棋谱进行学习,其实基本上是默认:凡是人类走的棋,都是好棋,甚至不太考虑某一步棋导致的输赢变化。也就是说,人类棋谱里可能有很多噪音,反而“教坏”了计算机。

3.世界上很多机器学习的问题其实并不需要人类所标记的数据。比如人脸识别,在早期需要把每张照片都标上张三李四王五,让计算机学习。后来,当数据量非常大了之后,机器学习可以自己作归类,不再需要人的干预。这一点也很容易理解,毕竟同一个人的不同照片,一定含有一些相同的特征,只是在机器学习的初级阶段,它不知道这些特征是什么。

4. 虽然今天以 DeepMind 为代表的计算机显示出了超强的智力,但是利用它们解决问题的一个前提是问题本身要定义清楚。如果问题定义不清,或者存在二义性(两种或两种以上的含义),计算机就会束手无策。

比如下围棋,规则和判定输赢的方法非常清晰。但是,在现实世界中,并非所有的问题都是这样清晰的。比如一个女孩为什么喜欢A 男孩而不喜欢 B 男孩,像这类没有清晰定义的问题,计算机就会无能为力。这其实是人和计算机在智能上的一个边界。

5. 在未来的时代,人的认知需要不断提升。我们根据少量样本所得到的经验既不是最好的,也远远不够用。因此,所有人(不仅是计算机行业的从业者)都需要了解计算机特殊的思维方式。

编辑 | 张嗣元 任雨

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171225B0YQT600?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券