2017人工智能与机器学习年终盘点（重要工具资源汇总）

小莹莹

发布于 2018-04-20 15:20:33

7700

发布于 2018-04-20 15:20:33

2017年是人工智能技术全面开火、勇猛精进的一年，也是对未来全球科技和经济影响深远的一年。

无论人工智能圈子内外的从业者，都开始正视这个可能会很快改变所有人命运的热门技术。关注、学习、思考、实践人工智能技术及其相关应用，将是所有IT人未来多年将要面对的最重要的课题和命题。以下根据WildML的报告，将2017年“万物并作”的人工智能和机器学习领域的重大进度节点和资源工具梳理如下：

完全不依赖人类知识经验的AlphaGo Zero击败人类，这比2016年AlphaGo击败李世石更加让人震惊

AlphaGo Zero的算法技术基于这篇已经发布的论文——《深度学习与树搜索的快思与慢思》，当时间来到2017年底，AlphaGo Zero的通用算法版本AlphaZero问世，这个算法突破了围棋领域的局限，砍瓜切菜般拿下了国际象棋、将棋等人类棋盘游戏的至尊宝座。至此，AlphaZero一统所有棋盘游戏江湖，成为水平远超人类的“棋神”。

AlphaGo Zero完成对AlphaGo Master的超越，以及避开人类经验干扰后产生的大量创新招法（参见谷歌发布的AlphaGo Zero围棋教学工具）已经完全突破了人类数千年总结的基本围棋规律和哲理，这意味着当面对极为复杂的计算难题（例如围棋、生物医药、环境、交通、软件开发等）时，人类的“宝贵”经验和大数据最终有可能成为一种“负资产”，或者用专业一点的术语说，是“脏数据”、对抗性样本，反而会阻碍机器突破人类智慧的天花板。

当人工智能开发的软件bug更少，效率更高、疾病误诊率更低、股票交易成绩更好、药品研发成本更低时，我们大量的知识工人可能面对一个可怕的未来，不是驾驭人工智能，而是被人工智能彻底淘汰。

其实不仅仅是AlphaGo，2017年还有很多人工智能算法也取得了令人瞩目的成就，首先是捷克科技大学、阿尔伯塔大学、查尔斯大学等联合研发的DeepStack首次击败了人类职业扑克选手，随后卡梅隆大学研发的人工智能算法Libratus（Science论文），在不完全信息的无限制一对一德州扑克比赛中击败了人类顶尖选手。

2018年，人工智能技术有望在多人游戏，例如扑克和星际争霸中战胜人类，DeepMind已经发布了针对星际争霸2的人工智能技术研究环境，OpenAI则演示了在一对一的Dota 2游戏中战胜人类的算法，并且计划不久的未来在5v5的多人对战游戏中也取得胜利。

进化式算法（Evolution Algorithms）东山再起

PHOTO：WIRED

对于监督式学习来说，使用反向传播算法的渐进式方法效果向来不错，未来短时间也不可能有太大变化。但是在增强学习中，进化策略（Evolution Strategies）却有东山再起的趋势。因为数据往往不是独立分布，或者错误信号较为稀疏，或者还有较大探索空间，算法通常不需要渐进式方法也能取得显著进步。另外，进化式算法可以线性扩展到数千台服务器来支持超快并行培训，计算不依赖昂贵的GPU，大量的廉价CPU就可以。

今年早些时候，OpenAI展示了进化策略能够取得与Deep Q-Learning这样的标准增强学习算法相当的成绩，时至年底，Uber的一个团队发表了一篇博客以及五篇研究论文，展示了Genetic算法的创新研究成果，一个极简化的Genetic算法，不借助任何渐进信息，可以学会较为复杂的Atari游戏，在Frostbite（冻伤）这个游戏中，Genetic算法打出了10500分，而一些顶尖人类玩家的得分不到1000。

技术流变：WaveNets、卷积神经网络（CNNs）与注意机制（Attention Mechanisms）

谷歌公司的Tacotron 2文本到语音系统生成的极为自然的机器声音样本让人印象深刻，该算法基于自回归模型——WaveNet，在过去一年中，该模型也在谷歌助理中使用并在高保真语音合成方面取得显著进步。此前WaveNet在机器翻译也得到应用并大大加快了培训速度，提高了回归架构的效率。

在机器学习这个子领域，放弃昂贵且需要较长培训时间的回归架构已经成为大势所趋，在Attention is all you Need一文中，研究者完全放弃了回归和卷积架构，使用一个更佳复杂的注意机制（Attention Mechanisms），能以低的多的成本，取得极为出色的机器翻译成绩。

深度学习框架群雄并起

图片：WIRED

回顾2017年的人工智能市场，深度学习框架绝对是主角，Facebook推出的重量级框架PyTorch擅长处理动态图谱架构，类似Chainer，赢得了自然语言处理专家们的喜爱，因为他们经常需要处理动态回归架构，谷歌的静态图谱框架Tensorflow在这方面有些捉襟见肘。

但是，TensorFlow依然是2017年的框架之王，二月份谷歌发布了稳定的Tensorflow1.0版本，目前其版本已经迭代到1.4.1，除了主体框架外，谷歌还发布了一系列Tensorflow的伴侣程序库，包括面向动态计算机图形的Tensorflow Fold、面向数据输入管线的Tensorflow Transform，以及DeepMind的高级Sonnet库。值得注意的是，Tensorfow团队还发布了一个eager execution执行模式，可以以类似PyTorch的方式处理动态计算机图形。

除了Google和Facebook两大巨头外，很多公司也跳上了机器学习框架的花车：

苹果发布了CoreML移动机器学习库

Uber团队发布了Pyro，一个深度概率编程语言

亚马逊发布了Gluon，一个MXNet高级API。

Uber公布了内部机器学习基础设施平台“米开朗基罗”的技术细节。

除了通用深度学习框架，还涌现了大量增强学习框架，例如：

OpenAI Roboschool一个机器人模拟的开源框架 OpenAI Baselines 一组高质量的增强学习算法实现用例 Tensorflow Agents 包含了为使用Tensorflow训练RL代理优化的基础架构 Unity ML Agents 可供研究者和开发者使用Unity 编辑器开发游戏和模拟器，然后用增强学习训练。 Nervana Coach 顶级增强学习算法的实验平台 Facebook’s ELF Facebook的游戏研发平台 DeepMind Pycolab 一个可定制化的gridworld游戏引擎 Geek.ai MAgent一个支持多代理的增强学习研究平台

为了进一步推广深度学习，还出现了一些面向web的深度学习框架，例如谷歌的Deeplearn.js以及MIL WebDNN。但百花齐放也有未老先衰的，例如此前非常流行的框架Theano就停更了。

深度学习与增强学习资源汇总

随着深度学习和增强学习的流行，相关的演讲、培训和课程资源越来越丰富，以下是部分精华资源传送：

The Deep RL Bootcamp 这是OpenAI和UC伯克利大学联合推出的增强学习基础讲座以及最新研究成果。
课程视频：卷积神经网络的视觉识别应用Convolutional Neural Networks for Visual Recognition . 课程网站点这里。
斯坦福大学自然语言处理课程2017冬季课程： Natural Language Processing with Deep Learning . 课程网址。
斯坦福大学课程：深度学习理论。
Coursera最新的深度学习进阶课程： Coursera Deep Learning specialization
蒙特利尔大学深度学习与增强学习夏季课程： Deep Learning and Reinforcement Summer School in Montreal
UC伯克利深度增强学习秋季课程： Deep Reinforcement Learning Fall 2017 course.
Tensorflow开发峰会： Tensorflow Dev Summit ，主要讨论深度学习基本问题和相关的Tensorflow API。

此外，几个重要的学术会议也都有在线会议资料可查阅，如果你想保持锋利，那么请关注以下几个会议网站：

NIPS 2017、 ICLR 2017 、 EMNLP 2017.

arXiv上值得学习的几篇重要的培训、调研、研究论文：

Deep Reinforcement Learning: An Overview
A Brief Introduction to Machine Learning for Engineers
Neural Machine Translation
Neural Machine Translation and Sequence-to-sequence Models: A Tutorial

人工智能重大应用之医药篇

解决重大医药和医疗问题是2017年人工智能界最常见的“忽悠”之一，但是对于没有医学背景的人来说，要想真正了解人工智能在这个领域的突破和进度并不容易（编者按：对于医学界人士来说往往也不容易），我们推荐阅读Oakden-Rayner的系列刺激性很强博客：人类医生的终结。

今年人工智能在医学领域最重大的，或者说最知名的突破来自斯坦福大学，该校的人工智能团队开发的算法在识别皮肤癌方面的准确性能够达到皮肤学专家的水平。有兴趣的读者可以查看这篇发表在《自然》杂志上的论文。

斯坦福大学另外一个团队开发的模型能够根据心电图信号诊断心率异常，也就是所谓的心律不齐，准确性超过心脏病学专家。（下图）

但是今年人工智能的医学应用也并非一帆风顺，例如DeepMind与英国国民健康机构NHS签订的协议错误连篇完全无法执行。而NIH向数据科学社区发布的胸腔X光片数据集经过检视后完全不符合医疗AI模型培训数据的要求。

人工智能重大应用之：计算机艺术家

马云曾曰：未来唯一值得学习的是艺术，因为其他都要被人工智能。但马云恐怕没有想到，2017年人工智能在艺术创作领域的突破最大。

2017年人工智能的一个热门话题是基于生成对抗网络的图像、音乐、草图和视频建模。NIPS 2017会议上首次展示了一个利用机器学习的创意设计工作室。

此类应用种最著名的是Google的QuikDraw，该工具使用神经网络来识别你的涂鸦。借助已经发布的数据集，你可以教会机器来替你作画（编者按：范曾画派有望东山再起）。

生成对抗网络（GAN）今年取得了巨大的进步，新的模型如CycleGAN、DiscoGAN和StarGAN在人脸生成等方面取得令人瞩目的成就。过去，GAN很难生成高解析度高仿真的人脸图像，但是pix2pixHD的演示让人们看到了希望。

人工智能重大应用之：自动驾驶

自动驾驶和共享出行领域影响力最大的几个科技巨头分别是Uber、Lyft、字母公司旗下的Waymo以及特斯拉。Unber年初在自动驾驶方面遭受了不小的挫折：由于软件bug发作，其试验车在旧金山连闯多个红灯。后来Uber与公众分享了其内部使用的汽车可视化平台。 2017年底，Uber的自动驾驶汽车项目完成了200万英里里程。

Waymo的自动驾驶项目于4月份首次上路，后来在亚利桑那州凤凰城的路试中甚至完全没有人类操作人员在车内。Waymo对外发布了相关场地和模拟测试的技术细节。

Waymo的车辆导航模拟演示

Lyft也宣布正在开发自动驾驶软硬件方案，目前在波士顿的试点项目正在进行中。特斯拉的自动驾驶技术Autopilot去年似乎没有太大更新，但一个新入局的重量级选手正在引起所有人的关注：苹果公司。蒂姆库克同志已经正式确认苹果正在致力于开发自动驾驶汽车的软件，苹果内部的研究者也在arXiv上发布了于地图相关的论文。