机器学习人工学weekly-2018/2/4

注意下面很多链接需要科学上网,无奈国情如此

1. Google相关的消息:

1.1 TF发布1.5正式版,跟之前提到的RC差不多,主要是增加了eager和lite,升级了CUDA和cuDNN的支持版本

链接:https://github.com/tensorflow/tensorflow/releases/tag/v1.5.0

1.2 Google和UCSF/Stanford/Chicago合作发的一篇用深度学习从EHR预测医院事件(病亡,住院等)论文。不太懂医学上应用,不过看到不光预测准确率提高了,而且在dnn里面加weight做attribution。这种工作估计也只有Google能做,首先那几个牛医院是不会把数据随便给一般公司的,其次看计算量,差不多要22年的GPU hours,没几个公司有那么多资源做这个事

Scalable and accurate deep learning for electronic health records

链接:https://arxiv.org/pdf/1801.07860.pdf

1.3 DeepMind开源Psychlab,在Lab环境里面模拟心理学和认知科学tasks,并用UNREAL做了一些测试,看起来UNREAL跟人类比起来还是有一些明显的短板

Open-sourcing Psychlab

博客链接:https://deepmind.com/blog/open-sourcing-psychlab/

1.4 Google Brain的Eric Jang(青年才俊)写了2篇blog讲normalizing flow(autoregressive模型比如wavenet用)

part 1: https://blog.evjang.com/2018/01/nf1.html

part 2: https://blog.evjang.com/2018/01/nf2.html

1.5 Sara Sabour(Capsule Network作者)公布了胶囊网络的代码

链接:https://github.com/Sarasra/models/tree/master/research/capsules

1.6 Google Colab现在可以用免费的K80 GPU了,大利好

教程:https://medium.com/deep-learning-turkey/google-colab-free-gpu-tutorial-e113627b9f5d

2. 这周EmTech China在北京开AI大会,去了很多大牛。可惜没有机会去现场,不过在头条上看到有一些视频。建议有兴趣的同学可以在头条上搜"DeepTech深科技",他们有发一些现场视频(非广告)

官网(无视频):http://www.emtechchina.cn/?lang=1

3. 这周看到一篇机器学习在金融领域(股价预测,return prediction等等)方面的应用,文章我都没看,但是看摘要基本上就是RNN跟传统方法的对抗 :) 对fintech或者投资有兴趣的同学可以看看

2017's Deep Learning Papers on Investing

链接:https://medium.com/@dmitryrastorguev/2017s-deep-learning-papers-on-investing-7489e8f59487

4. Bengio的MILA实验室发了他们参加Amazon Alexa chatbot比赛的MILABOT的短论文(这个是精简版,之前有一篇巨长的),用reinforcement learning做chatbot, 主要是用off-policy REINFORCE和Q-learning with the Abstract Discourse MDP

A Deep Reinforcement Learning Chatbot

链接:https://arxiv.org/pdf/1801.06700.pdf

其实用RL做对话也不是一个新鲜的idea,之前Stanford李纪为(牛人啊,从生物转CS在Stanford3年就PhD毕业然后去做香侬科技AI创业了)就用RL和GAN做对话生成,建议去读读他的博士论文:

Teaching Machines to Converse

链接:https://github.com/jiweil/Jiwei-Thesis

5. AlphaGo系列

5.1 这周看到2017 ICML Test of Time Award的视频,这个奖给了Google Brain Zurich的Sylvain Gelly和DeepMind的David Silver,他们的工作就是2007年用的online/offline 知识训练下围棋

在视频里面他们回顾了2007年的做法,online部分就是用MCTS,offline基本上是用手工特征的方法估算value/policy,所以不是很scalable。等到deep learning的时候他们把offline部分大大推进了(当然还有一些其他的改进),于是搞定了Go。这个过程花了10年时间啊,pretty amazing to take a retrospective view。看下面这个进展过程,最开始用的traditional search,很快就plateau了,然后用Monte Carlo有了一大步进展,但是也plateau了,最后用deep learning,几乎是直线上升,it's fabulous!

他们还在07年的时候就打赌说10年之后会完美解决Go,果然2017年彻底解决了。Sylvain Gelly早已经不做围棋了,David Silver坚持了10+才做出来,真心佩服!

强烈推荐视频:https://www.youtube.com/watch?v=Bm7zah_LrmE

5.2 David Silver在NIPS上的演讲清晰版视频出来了

链接:https://www.youtube.com/watch?v=Wujy7OzvdJk

5.3 Google的人在tensorflow repository里面发布了Minigo,相当于AlphaGo的开源版,虽然不是Google的官方项目

链接:https://github.com/tensorflow/minigo

5.4 AlphaZero我之前也写过快报,不过感觉下面这篇文章写的更清晰,是从AlphaGo一路讲,而且visualization也很漂亮,所以推荐

AlphaGo Zero - How and Why it Works

链接:http://tim.hibal.org/blog/alpha-zero-how-and-why-it-works/

5.5 另外这篇文章手把手教你怎么把AlphaZero用到另外游戏Connect4上

How to build your own AlphaZero AI using Python and Keras

链接:https://medium.com/applied-data-science/how-to-build-your-own-alphazero-ai-using-python-and-keras-7f664945c188

6. 模型解释性一向是ML被人诟病的大问题,这周看到的这个XGBoost Explainer(R)工具不错,可以解释boosting模型。GitHub上好像也有python版的

链接:https://medium.com/applied-data-science/new-r-package-the-xgboost-explainer-51dd7d1aa211

GitHub:https://github.com/AppliedDataSciencePartners/xgboostExplainer

7. tyro labs blog详解Faster R-CNN,通俗易懂,适合我这种不怎么看视觉文章的懒人

链接:https://tryolabs.com/blog/2018/01/18/faster-r-cnn-down-the-rabbit-hole-of-modern-object-detection/

8. 这个比较有趣,用YOLO做英雄联盟人物的识别,打游戏的人应该会觉得好玩

part1:https://medium.com/@farzatv/deepleague-leveraging-computer-vision-and-deep-learning-on-the-league-of-legends-mini-map-giving-d275fd17c4e0

part2:https://medium.com/@farzatv/deepleague-part-2-the-technical-details-374439e7e09a

9. NLP入门教程,涵盖了大部分的NLP基础人物,适合初学

教程:https://blog.insightdatascience.com/how-to-solve-90-of-nlp-problems-a-step-by-step-guide-fda605278e4e

10. CMU春节深度学习课程开始,视频slides皆有,初学可以去跟

链接:http://deeplearning.cs.cmu.edu/

原文发布于微信公众号 - 机器学习人工学weekly(MLandHuman)

原文发表时间:2018-02-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【抗击谷歌】亚马逊微软发布深度学习库,让训练神经网络像开发APP一样简单

【新智元导读】AWS和微软共同宣布了推出一个新的深度学习库Gluon。Gluon允许所有技能水平的开发者设计原型、创建和训练深度学习模型,部署在云端、终端设备或...

3768
来自专栏新智元

【遗失的秘钥】贝叶斯定理:人工智能的进化论?

贝叶斯定理正在变得如此流行,以至于在CBS剧《生活大爆炸》中也出现了它的身影。纽约时报说,贝叶斯统计学家“遍布一切,从物理学到癌症研究,从生态学到心理学”。物理...

3438
来自专栏大数据文摘

统计学速成班:谷歌首席决策工程师的一分钟入门指南

假设检验,P值,显著性水平,置信区间,功效分析到底是什么呢?这里有一份通俗易懂的讲解指南。本文介绍了统计学两大学派:频率学派和贝叶斯学派的基本观点,一起来看看大...

1206
来自专栏量子位

学AI的高中生还有5秒钟到达战场,请90后叔叔阿姨做好准备

这本给高中生的人工智能选修教材让许多人惊诧:现在高中生都这么前沿了么?甚至在海外,也有许多网友将其视为中国AI进一步崛起的一个证明。

1221
来自专栏企鹅号快讯

人工智能大数据背后的神秘公式:贝叶斯公式

转自:工业智能化 大数据、人工智能、海难搜救、生物医学、邮件过滤,这些看起来彼此不相关的领域之间有什么联系?答案是,它们都会用到同一个数学公式——贝叶斯公式。它...

6825
来自专栏ATYUN订阅号

Obvious用AI生成艺术画作,以43万美元拍卖价成交

机器是否能创造艺术,这个问题是许多争论的核心,并且已经持续了几十年。但它在市场上是否有价值呢?这一点在今天已经得到了明确的回答,一幅AI创作的肖像画在拍卖中以近...

1713
来自专栏IT派

NLP之Wrod2Vec三部曲

N o . 1 基础篇 一.前言 伴随着深度学习的大红大紫,只要是在自己的成果里打上deep learning字样,总会有人去看。深度学习可以称为当今机器学习...

3455
来自专栏新智元

【Nature 封面论文】机器学习掀起材料革命,人工智能或将颠覆人类科研方式

【新智元导读】昨日Nature封面论文:哈佛大学研究者借助机器学习算法,利用“废弃”数据成功预测新材料的合成,引发学界激论:人工智能真能加速发现神奇新材料吗?该...

4666
来自专栏专知

【观点】AlphaGo Zero再掀波澜,看各位AI业界大拿如何点评

【导读】Google DeepMind在Nature上发表最新论文AlphaGo Zero,介绍了迄今最强最新的版本AlphaGo Zero,不使用人类先验知识...

2984
来自专栏机器之心

学界 | AAAI 2018获奖论文提前揭晓:两大奖项花落阿尔伯塔、牛津

3224

扫码关注云+社区

领取腾讯云代金券