前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AI大事件 | Geoffrey Hinton决定抛弃反向传播,预期策略梯度算法

AI大事件 | Geoffrey Hinton决定抛弃反向传播,预期策略梯度算法

作者头像
大数据文摘
发布2018-05-24 18:01:56
5500
发布2018-05-24 18:01:56
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘作品

编译 | 宁云州

呜啦啦啦啦啦大家好呀,又到了本周的AI大事件时间了。过去的一周中AI圈都发生了什么?大佬们互撕了哪些问题?研究者们发布了哪些值得一读的论文?又有哪些开源的代码和数据库可以使用了?文摘菌带你盘点过去一周AI大事件!

了解过去一周AI爆点,一篇就够啦!

新闻

Geoffrey Hinton决定抛弃反向传播

来源:WWW.AXIOS.COM

链接:https://www.axios.com/ai-pioneer-advocates-starting-over-2485537027.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

现在几乎所有神经网络都会经过反向传播的训练。然而在最近的一次采访中,Hinton,深度学习之父却表示,他将“抛开一切重新开始”。要想在深度学习上向前推进,就必须发明全新的方法。

Facebook人工智能研究登陆蒙特利尔

来源:NEWSROOM.FB.COM

链接:https://newsroom.fb.com/news/2017/09/fair-montreal/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

作为Facebook的人工智能研究的一部分(FAIR),这个新的团队将由超过100名来自门洛帕克、纽约和巴黎的科学家组成,他们将努力推进人工智能领域的研究。

蒙特利尔实验室将对AI领域进行广泛的研究,但它也将特别关注强化学习和对话系统。

Sophia Genetics筹集了3000万美元帮助医生使用人工智能和基因组数据进行诊断

来源:VENTUREBEAT.COM

链接:https://venturebeat.com/2017/09/13/sophia-genetics-raises-30-million-to-help-doctors-diagnose-using-ai-and-genomic-data-analysis/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

9月13日消息,瑞士医疗数据分析公司Sophia Genetics宣布完成3000万美元D轮融资,Balderton Capital领投,Alychlo、Invoke Capital Partners、360 Capital Partners等跟投。

Sophia Genetics成立于2011年,是一家遗传信息数据分析公司,专注于通过人工智能找出患者基因突变原理,并结合专家意见提供个性化的治疗诊断方案。

文章&教程

学习其他代理想法的模型(OpenAI)

来源:BLOG.OPENAI.COM

链接:https://blog.openai.com/learning-to-model-other-minds/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

一种算法,它解释了其他代理也在学习的事实,并在迭代囚徒困境中发现了类似于针锋相对的合作策略。

AI健身房

来源:LEARNINGAI.IO

链接:https://learningai.io/projects/2017/07/28/ai-gym-workout.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

一个易于理解的近端策略优化( Proximal Policy Optimization)的介绍(PPO)并且能够很好的应对MuJoCo 和 RoboSchool 的环境。点击这里查看代码:https://github.com/pat-coady/trpo

使用强化学习达到最优化

来源:BAIR.BERKELEY.EDU

链接:http://bair.berkeley.edu/blog/2017/09/12/learning-to-optimize-with-rl/?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

机器学习的算法仍然是人工设计的。这就引出了一个自然的问题:我们可以学习这些算法吗?

项目&数据

使用TensorBoard API完成自定义可视化

来源:RESEARCH.GOOGLEBLOG.COM

链接:https://research.googleblog.com/2017/09/build-your-own-machine-learning.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

为了让学习者能够使用新的和有用的可视化进行创作,谷歌公布了一组API,允许开发人员添加自定义的可视化插件到TensorBoard。

膨胀残留网络(Dilated Residual Network)的实现

来源:GITHUB.COM

链接:https://github.com/fyu/drn?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

基于膨胀卷积的多元内容集成和膨胀残留网络的官方PyTorch实现。

对TensorFlow数据集和估计机制(Estimators)的介绍

来源:DEVELOPERS.GOOGLEBLOG.COM

链接:https://developers.googleblog.com/2017/09/introducing-tensorflow-datasets.html?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

TensorFlow 1.3介绍了两个重要的特点:数据集和估计机制。这篇文章显示了他们如何适应TensorFlow架构。

数据集 | 一万本最受欢迎的书:一万本书,六百万次阅读

来源:GITHUB.COM

链接:https://github.com/zygmuntz/goodbooks-10k?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

该数据集包含了goodreads.com上一万本最受欢迎的书,其中最受欢迎的被阅读了六百万次。

爆款论文

针对工程师的机器学习简介

来源:ARXIV.ORG

链接:https://arxiv.org/abs/1709.02840?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

一个200页的“简短”的介绍。这项工作旨在介绍机器学习中的关键概念、算法和理论框架,包括监督和无监督学习、统计学习理论、概率图形模型和近似推理。

把所有东西都嵌入进去!

来源:ARXIV.ORG

链接:https://arxiv.org/abs/1709.03856?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

一个通用的神经嵌入模型,可以解决各种各样的问题:标签型任务,如文本分类;排序型任务,如信息检索、网络搜索、基于协同过滤和基于内容的推荐;多关系图的嵌入,并能够实现单词、句子或文档级的嵌入。在每种情况下,模型都是通过嵌入由离散特征组成的实体来实现的,并将对它们进行比较——学习依赖于任务的相似性。

预期策略梯度算法

来源:ARXIV.ORG

链接:https://arxiv.org/abs/1706.05374?utm_campaign=Revue%20newsletter&utm_medium=Newsletter&utm_source=The%20Wild%20Week%20in%20AI

预期策略梯度算法(EPG:Expected policy gradients)使强化学习中的随机策略梯度算法(SPG: stochastic policy gradients )和确定性策略梯度算法(DPG: deterministic policy gradients )达成了一致。这一算法的灵感来自于预期的SARSA算法,EPG在估计梯度的时候整合了整个操作,而不是仅仅依赖于采样轨迹。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-09-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯智能对话平台
腾讯智能对话平台(Tencent Bot Platform,TBP)专注于“对话即服务”的愿景,全面开放腾讯对话系统核心技术,为大型企业客户、开发者和生态合作伙伴提供开发平台和机器人中间件能力,实现便捷、低成本构建人机对话体验和高效、多样化赋能行业。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档