专知-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

专知

专栏成员

835

文章

1416685

阅读量

397

订阅数

【论文推荐】最新六篇深度强化学习（ DRL）相关论文—VR眼镜、参数噪声、恶意软件、合成复杂程序、深度继承表示、自适应

强化学习人工智能深度学习

【导读】专知内容组整理了最近六篇深度强化学习（ Deep Reinforcement Learning）相关文章，为大家进行介绍，欢迎查看! 1. VR Goggles for Robots: Real-to-sim Domain Adaptation for Visual Control（机器人VR眼镜:用于视觉控制的Real-to-sim域自适应） ---- ---- 作者：Jingwei Zhang,Lei Tai,Yufeng Xiong,Ming Liu,Joschka Boedecker,Wol

2018-04-13

1.1K0

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

机器人强化学习人工智能

【导读】专知内容组整理了最近五篇聊天机器人（Chatbot）相关文章，为大家进行介绍，欢迎查看! 1. A Deep Reinforcement Learning Chatbot (Short Version)（一种深度强化学习的聊天机器人） ---- ---- 作者：Iulian V. Serban,Chinnadhurai Sankar,Mathieu Germain,Saizheng Zhang,Zhouhan Lin,Sandeep Subramanian,Taesup Kim,Michael Pi

2018-04-13

2K0

【论文推荐】最新5篇深度强化学习相关论文推荐—经验驱动的网络、自动数据库管理、双光技术推荐系统、UAVs、多代理竞争对手

强化学习数据库推荐系统人工智能

【导读】专知内容组整理了最近强化学习相关文章，为大家进行介绍，欢迎查看! 1. Experience-driven Networking: A Deep Reinforcement Learning based Approach（经验驱动的网络:一种基于深度强化学习的方法） ---- ---- 作者：Zhiyuan Xu,Jian Tang,Jingsong Meng,Weiyi Zhang,Yanzhi Wang,Chi Harold Liu,Dejun Yang 摘要：Modern communicat

2018-04-13

4.3K0

【论文推荐】最新八篇强化学习相关论文—残差网络、QMIX、元学习、动态速率分配、分层强化学习、抽象概况、快速物体检测、SOM

强化学习人工智能

【导读】专知内容组整理了最近八篇强化学习（Reinforcement learning）相关文章，为大家进行介绍，欢迎查看! 1.BlockDrop: Dynamic Inference Paths in Residual Networks（BlockDrop:残差网络中的动态推断路径） ---- ---- 作者：Zuxuan Wu,Tushar Nagarajan,Abhishek Kumar,Steven Rennie,Larry S. Davis,Kristen Grauman,Rogerio Fer

2018-04-13

1.4K0

春节充电系列：李宏毅2017机器学习课程学习笔记01之简介

机器学习监督学习无监督学习迁移学习强化学习

【导读】春节将近，在亲友相聚之余也不忘给自己充充电。为此，专知内容组给大家带来了台大李宏毅老师的2017年机器学习课程系列学习笔记。今天我们先来看一下该系列课程的内容简介。从本质上来讲，机器学习可以分为三部分：函数集（也就是model）、评价函数好坏的标准、训练集。该课程中机器学习的大致内容包括：有监督学习、无监督学习、半监督学习、回归、分类、迁移学习、结构化学习、强化学习。今天我们就来总览一下这些技术，并在后续的更新中跟大家一一介绍。课件网址： http://speech.ee.ntu.edu.tw/~

2018-04-13

8040

Richard S. Sutton经典图书：《强化学习导论》第二版（附PDF下载）

强化学习人工智能

【导读】Richard S. Sutton就职于iCORE大学计算机科学系，是强化学习领域的专家，其在强化学习领域的著作“Reinforcement Learning”一直是认为是强化学习方面的圣经，

2018-04-13

10.4K78

【论文推荐】最新5篇知识图谱相关论文—强化学习、习知识图谱的表示、词义消除歧义、并行翻译嵌入、图数据库

强化学习人工智能机器学习

【导读】专知内容组整理了最近五篇知识图谱（Knowledge Graph）相关文章，为大家进行介绍，欢迎查看! 1. DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning（DeepPath:一种知识图推理的强化学习方法） ---- 作者：Wenhan Xiong,Thien Hoang,William Yang Wang 摘要：We study the problem of learning to reason in

2018-04-12

1.5K0

Seq2seq强化学习实战 (Pytorch, Tensorflow, Theano)

强化学习 pytorch tensorflow 机器学习深度学习

【导读】本文是Kirti Bakshi在1月14日写的关于其强化学习课程的一个介绍，作者首先简单介绍了机器学习的缺点，以及为什么使用深度学习。然后讲述了其开设的课程的主要内容，包括：强化学习基础、实用

2018-04-12

1.1K0

AI与深度学习重点回顾：Denny Britz眼中的2017

人工智能深度学习强化学习编程算法开源

【导读】近日，博客WILDML的作者Denny Britz把他眼中的2017年AI和深度学习的大事进行了一番梳理和总结：从AlphaGo的自主学习到AlphaGo Zero的强化学习、进化算法的东山再

2018-04-12

8130

【2017年末AI最新论文精选】词向量fasttext，CNN is All，强化学习，自回归生成模型, 可视化神经网络损失函数

人工智能强化学习神经网络

【导读】专知内容组整理出最近arXiv放出的五篇论文，包括《Tomas Mikolov新作词向量表示，CNN Is All You Need，强化学习库, 自回归生成模型, 揭开神经网络中损失函数的神秘面纱》，每篇都有干货，值得大家收藏阅读。 ▌1. Tomas Mikolov新作:高质量的词向量表示 ---- 题目： Advances in Pre-Training Distributed Word Representations 作者：Tomas Mikolov, Edouard Grave, Piot

2018-04-12

8480

【干货】初学者的深度学习论文打怪升级指南

深度学习人工智能无监督学习强化学习

，【导读】人工智能研究专家Flood Sung针对近几年深度学习的研究进展提供了一个非常详细的阅读清单。如果你在深度学习领域是一个新手，你可以会想知道如何从哪篇论文开始阅读学习，人工智能研究专家Flood Sung制定了这一份详细的paper list，包括深度学习历史和基础知识、深度学习方法（涉及模型、优化、无监督学习、RNN、深度强化学习等）、深度学习应用（自然语言处理、目标检测、视觉跟踪、图像描述生成、机器翻译、机器人、目标分割等），建议你收藏，仔细学习。 Github 地址： https://git

2018-04-11

7510

【干货】首次使用分层强化学习框架进行视频描述生成，王威廉组最新工作

【导读】加州大学-圣塔芭芭拉计算王威廉组最新工作Video Captioning via Hierarchical Reinforcement Learning ，首次提出分层强化学习方法来加强不同等级的视频描述，通过分层深度强化学习，在文本生成上可以做到语言表达更加连贯，语义更加丰富，语法更加结构化。达在MSR－VTT数据集上达到了的最佳结果，并且提出了新的Charades Caption数据集。文章中指出，未来将计划注意力机制（Attention），以提升提出的层次强化学习（HRL）框架。作者相信，提出

2018-04-11

2K0

【资源】Python强化学习实战，Anaconda公司的高级数据科学家讲解（附相关Python开源库）

python 强化学习 anaconda 开源

【导读】Christine Doig是Anaconda公司的高级数据科学家。没错Anaconda就是那个著名的Python科学计算与发行管理软件。Christine Doig从最基本的强化学习概念开始

2018-04-11

6820

【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》

强化学习人工智能

【导读】IT资深工程师和人工智能技术专家Abhishek Nandy和Manisha Biswas撰写的Open AI, TensorFlow, Keras强化学习实战《Reinforcement Learning With Open AI, TensorFlow and Keras Using Python》深入浅出地讲解了强化学习各个模块以及实际场景应用。这本书主要为数据科学家和机器学习专业人员，软件开发人员，研究生和开源爱好者服务，教你使用Open AI Gym, Open AI，并用TensorFl

2018-04-11

1.7K0

【新加坡国立大学张戎】深度学习与强化学习（附slide下载）

深度学习强化学习人工智能

来源： https://cloud.tencent.com/developer/article/1006637 随着 DeepMind 公司的崛起，深度学习和强化学习已经成为了人工智能领域的热门研究方向。除了众所周知的 AlphaGo 之外，DeepMind 之前已经使用深度学习与强化学习的算法构造了能够自动玩 Atari 游戏的 AI，并且在即时战略游戏 StarCraft II 的游戏 AI 构建上做出了自己的贡献。虽然目前还没有成功地使用 AI 来战胜 StarCraft II 的顶尖职业玩家，但是

2018-04-11

1.1K0

南京大学周志华教授对话《科学通报》你担心“人工智能威胁论”吗

人工智能机器学习数据挖掘强化学习

来源：科学出版社周志华教授周志华教授主要从事人工智能、机器学习、数据挖掘领域的研究工作, 现任南京大学计算机软件新技术国家重点实验室常务副主任、校学术委员会委员, 2003年获国家杰出青

2018-04-11

8460

【DeepMind最新论文】新AlphaZero出世称霸棋界，8小时搞定一切棋类！自对弈通用强化学习无师自通！

强化学习人工智能神经网络

【导读】从AlphoGo Zero 到AlphaZero只是少了一个词“围棋”(Go), 但是背后却代表着Hassabis将和他的DeepMind继续朝着“创造解决世界上一切问题的通用人工智能”这一目标道路上迈出了巨大的一步。今天DeepMind在arXiv发表论文表示其开发的通用强化学习程序AlphaZero,使用蒙特卡洛树搜索（MCTS）和深度神经网络，和强大的算力，同时在国际象棋，日本将棋和围棋中战胜各自领域的最强代表。而且这一切都是通过自我对弈完成的，在训练中除了游戏规则，不提供任何额外的领域知识。

2018-04-11

9010

【深度学习进阶模型详解】概率图模型/深度生成模型/深度强化学习，复旦邱锡鹏老师《神经网络与深度学习》教程分享05（附pdf下载）

深度学习强化学习神经网络 NLP 服务

【导读】复旦大学副教授、博士生导师、开源自然语言处理工具FudanNLP的主要开发者邱锡鹏（http://nlp.fudan.edu.cn/xpqiu/）老师撰写的《神经网络与深度学习》书册，是国内为数不多的深度学习中文基础教程之一，每一章都是干货，非常精炼。邱老师在今年中国中文信息学会《前沿技术讲习班》做了题为《深度学习基础》的精彩报告，报告非常精彩，深入浅出地介绍了神经网络与深度学习的一系列相关知识，基本上围绕着邱老师的《神经网络与深度学习》一书进行讲解。专知希望把如此精华知识资料分发给更多AI从业者，

2018-04-10

2.9K0

【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测

深度学习人工智能强化学习

点击上方“专知”关注获取更多AI知识! 【导读】Google DeepMind在Nature上发表最新论文，介绍了迄今最强最新的版本AlphaGo Zero，不使用人类先验知识，使用纯强化学习，将价值网络和策略网络整合为一个架构，3天训练后就以100比0击败了上一版本的AlphaGo。Alpha Zero的背后核心技术是深度强化学习，为此，专知有幸邀请到叶强博士根据DeepMind AlphaGo的研究人员David Silver《深度强化学习》视频公开课进行创作的中文学习笔记，在专知发布推荐给大家！（关注

2018-04-10

1.1K0

【观点】Facebook人工智能组研究员田渊栋：关于AI的一些杂谈

人工智能强化学习

来源：https://zhuanlan.zhihu.com/p/30750293 关于AlphaGo AlphaGo厉害的地方在于结合了工程和科研两方面的工作，通过大量计算资源和工程优化将一个方向推向了极致，并且同时借鉴了十年来大家在围棋上及在计算机视觉上的点滴进展，围棋和强化学习方向上像蒙特卡罗树搜索，自对弈（俗称“左右互搏”），随机走子盘面估值，用人工特征加浅层网络进行快速走子，权衡广度和深度搜索，权衡从头探索和先验知识，计算机视觉方向上像卷积神经网络（CNN），残差网络（ResNet），旋转翻折样本增

2018-04-09

6900

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态