机器学习人工学weekly-2018/3/11

换了个新职位非常忙,我还会每周更新,但是估计是没时间仔细读论文了,所以评论可能就没什么深度了,精力有限,哎。

1. DeepMind新RL学习方式SAC-X,尝试通过auxiliary task来解决sparse reward问题(跟UNREAL有些关系)

Learning by playing

blog:https://deepmind.com/blog/learning-playing/

链接:https://arxiv.org/pdf/1802.10567.pdf

2. Google Brain通过增加auxiliary loss的方法改进LSTM

Learning Longer-term Dependencies in RNNs with Auxiliary Losses

链接:https://arxiv.org/abs/1803.00144

3. 阿里发布用多agent RL提高广告收益的论文

Deep Reinforcement Learning for Sponsored Search Real-time Bidding

链接:https://arxiv.org/abs/1803.00259

4. variational autoencoders讲的最清楚的视频(Arxiv Insights这个账号值得follow)

链接:https://www.youtube.com/watch?utm_campaign=Revue+newsletter&utm_medium=Newsletter&utm_source=The+Wild+Week+in+AI&v=9zKuYvjFFS8

5. Intel MobileEye发的一篇论文,把很多自驾车的安全问题用数学方法表示出来

On a Formal Model of Safe and Scalable Self-driving Cars

链接:https://arxiv.org/pdf/1708.06374.pdf

6. NLP的前沿研究问题,都是NLP的高级问题

链接:http://ruder.io/requests-for-research/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

7. 框架/工具/资源

7.1 Berkeley RISE实验室的Panda on Ray,用并行化加速Panda处理数据

链接:https://rise.cs.berkeley.edu/blog/pandas-on-ray/

7.2 instacart开源lore,把整个机器学期的pipeline都包进去

链接:https://github.com/instacart/lore

简单教程:https://tech.instacart.com/how-to-build-a-deep-learning-model-in-15-minutes-a3684c6f71e

7.3 Alpha Zero Chess

链接:https://github.com/Zeta36/chess-alpha-zero

7.4 TF教程(有视频),看起来不错

链接:https://github.com/Hvass-Labs/TensorFlow-Tutorials

7.5 word vector教程

链接:https://gist.github.com/aparrish/2f562e3737544cf29aaf1af30362f469

7.6 微软发布MMdnn,让各个框架之间的模型互相转化,感觉跟ONNX有点重叠啊

链接:https://github.com/Microsoft/MMdnn

7.7 用keras实现各种GAN

链接:https://github.com/eriklindernoren/Keras-GAN?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

7.8 TF 1.6发布了

链接:https://github.com/tensorflow/tensorflow/releases

*Waymo发布VR视频,里面很清楚的可以看到LiDAR/radar/camera的perception,sensor fusion, planning, mapping等等

链接:https://www.youtube.com/watch?time_continue=70&v=B8R148hFxPw

原文发布于微信公众号 - 机器学习人工学weekly(MLandHuman)

原文发表时间:2018-03-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏灯塔大数据

洞察|美国大选倒计时:R 语言和蒙特卡洛算法预测希拉里赢面高达89%

距总统大选不到一周,来预测一下竞选结果还是很有挺有趣的。虽然关于选举,有的是博客和网站的预测,但确切告诉你他们究竟用了什么模型,或者告诉你怎么做这个预测的却寥...

38790
来自专栏月色的自留地

NMF学习练习:做电影推荐

14170
来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/6/10

1. MIT脑科学课程视频,虽然跟工程不太一样,但是cognitive science也是很重要

13760
来自专栏AI科技评论

动态 | ACL 2018 公布四篇最佳 demo 候选论文,三篇论文第一作者来自中国

雷锋网 AI 科技评论按:7 月 9 日,自然语言处理顶会 ACL 公布了最佳 demo 论文的四篇候选论文,名单如下:

14440
来自专栏技术翻译

10个用于人工智能的开源工具/框架

TensorFlow™是一个开源软件库,最初由研究Google Brain Team的研究人员和工程师开发。TensorFlow用于使用数据流图进行数值计算。图...

1.6K20
来自专栏CreateAMind

TensorFlow-dev-summit:那些TensorFlow上好玩的和黑科技

本文属于介绍性文章,其中会介绍许多TensorFlow的新feature和summit上介绍的一些有意思的案例,文章比较长,可能会花费30分钟到一个小时

13520
来自专栏新智元

让神经网络替你编程:如何用深度学习实现程序自动合成

【新智元导读】本文介绍了训练神经网络学习用复杂的函数式语言(FlashFill DSL)进行编程取得的成功,标志着神经程序合成方面一个令人兴奋的突破。 ● 作...

43480
来自专栏我是攻城师

网页去重思路浅析(一)

46480
来自专栏AI研习社

用机器学习搞艺术,谷歌 Megenta 项目集锦(附 Github)

雷锋网 AI 研习社按:本文为雷锋字幕组编译的技术博客,原文 Make Music and Art Using Machine Learning,作者 mage...

17320
来自专栏华章科技

用 Python 20 秒画完小猪佩奇“社会人”!附效果视频+完整代码

导读:今年社交平台上最火的带货女王是谁?范冰冰?杨幂?Angelababy?不,是猪猪女孩小猪佩奇。

26350

扫码关注云+社区

领取腾讯云代金券