AI与深度学习-2017年总结

2017年AI界出现了很多进展,虽说没有像之前CNN、RNN、GAN出现时的转折,但也有很大的突破,特别是当Alpha Zero出现,强化学习的地位一下子飞升。下面将从算法、模型、框架以及数据出发,简单总结一下2017年的动态。

No.1 算法

强化学习当属2017年的重头戏,从AlphaZero出现并战胜AlphaGo开始引爆。AlphaGo是基于历史数据进行有监督学习,进阶版本的Alpha Master是通过self-learning自己与自己对战不断提升得到。但AlphaZero是通过强化学习从零开始学习,定义好游戏规则,算法中选用两个Agent,选取policy作用,作用完后得到反馈的reward不断迭代优化。启发式的搜索算法也因为强化学习又一次被关注。目前强化学习仅仅在二人对战的游戏中使用,例如Google DeepMind在2017年发布了1v1的Dota2对战成绩,在多人对战以及多人游戏仍在继续研究。有可能在2018年见证Dota2 5v5的机器对战。

进化算法作为另一种启发式的搜索算法在2017年也得到了突破。一方面由于进化算法复杂度低,可以在大规模的CPU上进行训练;另一方面,对于神经网络算法一般采用梯度下降的方法,如果数据稀疏或者错误数据较多会比较麻烦,而进化算法可以很好地避免这一问题。在2017年底,Uber的一个团队发布了一篇博客,提出遗传算法(GA)的潜力,使用简单的遗传决策就能做好游戏policy(https://eng.uber.com/deep-neuroevolution/)。

No.2 模型

模型上的改进值得一提的是Attention Mechanism(注意力机制),各种变型各种应用,最早出现在图像,后来用于自然语言处理。注意力机制有很多种分类,2017年的主要突破有self-attention,cross-attention,structured-attention等,有兴趣的同学可以阅读相关论文了解详情。

模型上另外一种改进是引入了强化学习,构建深度强化学习模型。一般是使用深度学习做特征表达,然后使用强化学习搜索structure,再利用这种比较好的特征表达再次学习。具体可以参考论文”A Deep Reinforcement LearningChatbot”。

No. 3 数据

没有数据就不能做深度学习,2017年开源的数据主要包括:

Youtube Bounding Boxes

Google QuickDraw Data

DeepMind Open Source Datasets

Google Speech Commands Dataset

Atomic Visual Actions

Several updates to the Open Images data set

Nsynth dataset of annotated musical notes

Quora Question Pairs

No.4 深度学习框架

深度学习框架在2017年可谓是飞速发展,最值得一提的是两个:(1)Facebook等公司联合发布的Pytorch,相比早前谷歌发布的tensorflow能够支持动态图计算,之前版本的tensorflow只能先在python部分定义好网络,然后给backend的C代码运行,这不能修改网络不能给出网络中间结果,很不方便。感谢Facebook,感谢Pytorch。(2)得益于Pytorch的发布,google估计害怕丢失用户,立马修改tensorflow,在2017年尾发布了能够支持动态图计算的tensorflow版本。

No. 5 业界动态

李飞飞携手谷歌在中国北京建立谷歌中国区AI研究院;李航加入头条;Andrew离开百度;百度IDL又引入三位学术界大佬;多家公司的无人驾驶已经上路;谷歌的TPU已经在云平台可用;阿里部署无人超市等。

当然还存在一些吹嘘过头的,例如IBM的沃森、以及医疗方面的AI助手等。

No. 6 强化学习资源

UCL DavidSilver的强化学习课程:http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html

RichardS. Sutton and Andrew G. Barto的强化学习书籍

原文发布于微信公众号 - CodeInHand(CodeInHand)

原文发表时间:2018-01-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

Yoshua Bengio清华最新演讲:深度学习AI迈向人类水平还面临这些挑战(内含PPT及讲座录音)

被称为“人工智能三巨头”之一的蒙特利尔大学计算机科学与运算研究系教授Yoshua Bengio为清华的师生带来了一场长达一个半小时的充实演讲。

1042
来自专栏量子位

Google开启全新图像目标检测大赛,场景多样性和复杂度史无前例

1122
来自专栏新智元

AI并不需要互联网:利用有性生殖,合成更多样、紧凑的神经网络

来源:uwaterloo.ca 作者:闻菲 【新智元导读】滑铁卢大学的研究人员,借鉴有性生殖让后代更能适应环境的道理,在虚拟环境中让神经网络完成“交配仪式”,同...

3294
来自专栏目标检测和深度学习

使用Faster R-CNN、ResNet诊断皮肤病,深度学习再次超越人类专家

选自IEEE 作者:Jeremy Hsu 机器之心编译 由于在特征识别任务上具有优势,医疗图像诊断一直是人工智能技术应用的重要方向。近日,韩国研究人员应用深度学...

41614
来自专栏AI科技评论

一张 AI 的「自画像」

AI 应该长什么样子?人们给出常见的答案不外乎是:像个机器人,像一组闪烁的 LED 灯,或者像电脑屏幕上一组变幻莫测的波形。那么在 AI 的眼中,一个 AI 应...

1123
来自专栏华章科技

大数据下客户金融产品购买概率预测

本文讨论用逻辑回归模型预测在金融市场情景下客户对金融产品的购买概率,以股票购买持仓概率作为研究对象。并探讨了TB级百万特征金融数据处理方法。

1274
来自专栏机器之心

使用Faster R-CNN、ResNet诊断皮肤病,深度学习再次超越人类专家

选自IEEE 作者:Jeremy Hsu 机器之心编译 由于在特征识别任务上具有优势,医疗图像诊断一直是人工智能技术应用的重要方向。近日,韩国研究人员应用深度学...

7355
来自专栏数据派THU

独家 | 一文读懂社交网络分析-上(附学习资源)

(点击可查看大图) 本文主要阐述: 社交网络的结构特性与演化机理 社交网络群体行为形成与互动规律 社交网络信息传播与演化机理 浏览后四章的内容请见下篇(2017...

84810
来自专栏机器之心

学界 | 学术盛宴:微软亚洲研究院CVPR 2017论文分享会全情回顾

机器之心原创 作者:Smith 今年 7 月,世界顶级计算机视觉会议 CVPR(计算机视觉与模式识别会议)将在美国夏威夷举行。在此之前,「微软亚洲研究院创研论坛...

5006
来自专栏量子位

牛津教授吐槽DeepMind心智神经网络,还推荐了这些多智能体学习论文

在Machine Theory of Mind中,DeepMind提出了“机器心智理论网络”ToMnet,让AI智能体能理解自己和周围智能体的情绪、意图、欲望等...

1072

扫码关注云+社区

领取腾讯云代金券