首页
学习
活动
专区
工具
TVP
发布

专知

专栏作者
835
文章
1370382
阅读量
397
订阅数
【论文推荐】最新六篇深度强化学习( DRL)相关论文—VR眼镜、参数噪声、恶意软件、合成复杂程序、深度继承表示、自适应
【导读】专知内容组整理了最近六篇深度强化学习( Deep Reinforcement Learning)相关文章,为大家进行介绍,欢迎查看! 1. VR Goggles for Robots: Real-to-sim Domain Adaptation for Visual Control(机器人VR眼镜:用于视觉控制的Real-to-sim域自适应) ---- ---- 作者:Jingwei Zhang,Lei Tai,Yufeng Xiong,Ming Liu,Joschka Boedecker,Wol
WZEARW
2018-04-13
1.1K0
【论文推荐】最新5篇聊天机器人(Chatbot)相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇
【导读】专知内容组整理了最近五篇聊天机器人(Chatbot)相关文章,为大家进行介绍,欢迎查看! 1. A Deep Reinforcement Learning Chatbot (Short Version)(一种深度强化学习的聊天机器人) ---- ---- 作者:Iulian V. Serban,Chinnadhurai Sankar,Mathieu Germain,Saizheng Zhang,Zhouhan Lin,Sandeep Subramanian,Taesup Kim,Michael Pi
WZEARW
2018-04-13
1.9K0
【论文推荐】最新5篇深度强化学习相关论文推荐—经验驱动的网络、自动数据库管理、双光技术推荐系统、UAVs、多代理竞争对手
【导读】专知内容组整理了最近强化学习相关文章,为大家进行介绍,欢迎查看! 1. Experience-driven Networking: A Deep Reinforcement Learning based Approach(经验驱动的网络:一种基于深度强化学习的方法) ---- ---- 作者:Zhiyuan Xu,Jian Tang,Jingsong Meng,Weiyi Zhang,Yanzhi Wang,Chi Harold Liu,Dejun Yang 摘要:Modern communicat
WZEARW
2018-04-13
4.2K0
【论文推荐】最新八篇强化学习相关论文—残差网络、QMIX、元学习、动态速率分配、分层强化学习、抽象概况、快速物体检测、SOM
【导读】专知内容组整理了最近八篇强化学习(Reinforcement learning)相关文章,为大家进行介绍,欢迎查看! 1.BlockDrop: Dynamic Inference Paths in Residual Networks(BlockDrop:残差网络中的动态推断路径) ---- ---- 作者:Zuxuan Wu,Tushar Nagarajan,Abhishek Kumar,Steven Rennie,Larry S. Davis,Kristen Grauman,Rogerio Fer
WZEARW
2018-04-13
1.4K0
春节充电系列:李宏毅2017机器学习课程学习笔记01之简介
【导读】春节将近,在亲友相聚之余也不忘给自己充充电。为此,专知内容组给大家带来了台大李宏毅老师的2017年机器学习课程系列学习笔记。今天我们先来看一下该系列课程的内容简介。从本质上来讲,机器学习可以分为三部分:函数集(也就是model)、评价函数好坏的标准、训练集。该课程中机器学习的大致内容包括:有监督学习、无监督学习、半监督学习、回归、分类、迁移学习、结构化学习、强化学习。今天我们就来总览一下这些技术,并在后续的更新中跟大家一一介绍。 课件网址: http://speech.ee.ntu.edu.tw/~
WZEARW
2018-04-13
7890
Richard S. Sutton经典图书:《强化学习导论》第二版(附PDF下载)
【导读】Richard S. Sutton就职于iCORE大学计算机科学系,是强化学习领域的专家,其在强化学习领域的著作“Reinforcement Learning”一直是认为是强化学习方面的圣经,
WZEARW
2018-04-13
9.7K67
【论文推荐】最新5篇知识图谱相关论文—强化学习、习知识图谱的表示、词义消除歧义、并行翻译嵌入、图数据库
【导读】专知内容组整理了最近五篇知识图谱(Knowledge Graph)相关文章,为大家进行介绍,欢迎查看! 1. DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning(DeepPath:一种知识图推理的强化学习方法) ---- 作者:Wenhan Xiong,Thien Hoang,William Yang Wang 摘要:We study the problem of learning to reason in
WZEARW
2018-04-12
1.5K0
Seq2seq强化学习实战 (Pytorch, Tensorflow, Theano)
【导读】本文是Kirti Bakshi在1月14日写的关于其强化学习课程的一个介绍,作者首先简单介绍了机器学习的缺点,以及为什么使用深度学习。然后讲述了其开设的课程的主要内容,包括:强化学习基础、实用
WZEARW
2018-04-12
1.1K0
AI与深度学习重点回顾:Denny Britz眼中的2017
【导读】近日,博客WILDML的作者Denny Britz把他眼中的2017年AI和深度学习的大事进行了一番梳理和总结:从AlphaGo的自主学习到AlphaGo Zero的强化学习、进化算法的东山再
WZEARW
2018-04-12
7850
【2017年末AI最新论文精选】词向量fasttext,CNN is All,强化学习,自回归生成模型, 可视化神经网络损失函数
【导读】专知内容组整理出最近arXiv放出的五篇论文,包括《Tomas Mikolov新作词向量表示,CNN Is All You Need,强化学习库, 自回归生成模型, 揭开神经网络中损失函数的神秘面纱》,每篇都有干货,值得大家收藏阅读。 ▌1. Tomas Mikolov新作:高质量的词向量表示 ---- 题目: Advances in Pre-Training Distributed Word Representations 作者:Tomas Mikolov, Edouard Grave, Piot
WZEARW
2018-04-12
8340
【干货】初学者的深度学习论文打怪升级指南
,【导读】人工智能研究专家Flood Sung针对近几年深度学习的研究进展提供了一个非常详细的阅读清单。如果你在深度学习领域是一个新手,你可以会想知道如何从哪篇论文开始阅读学习,人工智能研究专家Flood Sung制定了这一份详细的paper list,包括深度学习历史和基础知识、深度学习方法(涉及模型、优化、无监督学习、RNN、深度强化学习等)、深度学习应用(自然语言处理、目标检测、视觉跟踪、图像描述生成、机器翻译、机器人、目标分割等),建议你收藏,仔细学习。 Github 地址: https://git
WZEARW
2018-04-11
7290
【干货】首次使用分层强化学习框架进行视频描述生成,王威廉组最新工作
【导读】加州大学-圣塔芭芭拉计算王威廉组最新工作Video Captioning via Hierarchical Reinforcement Learning ,首次提出分层强化学习方法来加强不同等级的视频描述,通过分层深度强化学习,在文本生成上可以做到语言表达更加连贯,语义更加丰富,语法更加结构化。达在MSR-VTT数据集上达到了的最佳结果,并且提出了新的Charades Caption数据集。文章中指出,未来将计划注意力机制(Attention),以提升提出的层次强化学习(HRL)框架。作者相信,提出
WZEARW
2018-04-11
1.9K0
【资源】Python强化学习实战,Anaconda公司的高级数据科学家讲解(附相关Python开源库)
【导读】Christine Doig是Anaconda公司的高级数据科学家。没错Anaconda就是那个著名的Python科学计算与发行管理软件。Christine Doig从最基本的强化学习概念开始
WZEARW
2018-04-11
6650
【下载】面向Open AI, TensorFlow, Keras的强化学习书籍《Reinforcement Learning》
【导读】IT资深工程师和人工智能技术专家Abhishek Nandy和Manisha Biswas撰写的Open AI, TensorFlow, Keras强化学习实战《Reinforcement Learning With Open AI, TensorFlow and Keras Using Python》深入浅出地讲解了强化学习各个模块以及实际场景应用。这本书主要为数据科学家和机器学习专业人员,软件开发人员,研究生和开源爱好者服务,教你使用Open AI Gym, Open AI,并用TensorFl
WZEARW
2018-04-11
1.7K0
【新加坡国立大学张戎】深度学习与强化学习(附slide下载)
来源: https://cloud.tencent.com/developer/article/1006637 随着 DeepMind 公司的崛起,深度学习和强化学习已经成为了人工智能领域的热门研究方向。除了众所周知的 AlphaGo 之外,DeepMind 之前已经使用深度学习与强化学习的算法构造了能够自动玩 Atari 游戏的 AI,并且在即时战略游戏 StarCraft II 的游戏 AI 构建上做出了自己的贡献。虽然目前还没有成功地使用 AI 来战胜 StarCraft II 的顶尖职业玩家,但是
WZEARW
2018-04-11
1.1K0
南京大学周志华教授对话《科学通报》你担心“人工智能威胁论”吗
来源:科学出版社 周志华教授 周志华教授主要从事人工智能、机器学习、数据挖掘领域的研究工作, 现任南京大学计算机软件新技术国家重点实验室常务副主任、校学术委员会委员, 2003年获国家杰出青
WZEARW
2018-04-11
8210
【DeepMind最新论文】新AlphaZero出世称霸棋界 ,8小时搞定一切棋类!自对弈通用强化学习无师自通!
【导读】从AlphoGo Zero 到AlphaZero只是少了一个词“围棋”(Go), 但是背后却代表着Hassabis将和他的DeepMind继续朝着“创造解决世界上一切问题的通用人工智能”这一目标道路上迈出了巨大的一步。今天DeepMind在arXiv发表论文表示其开发的通用强化学习程序AlphaZero,使用蒙特卡洛树搜索(MCTS)和深度神经网络,和强大的算力,同时在国际象棋,日本将棋和围棋中战胜各自领域的最强代表。而且这一切都是通过自我对弈完成的,在训练中除了游戏规则,不提供任何额外的领域知识。
WZEARW
2018-04-11
8660
【深度学习进阶模型详解】概率图模型/深度生成模型/深度强化学习,复旦邱锡鹏老师《神经网络与深度学习》教程分享05(附pdf下载)
【导读】复旦大学副教授、博士生导师、开源自然语言处理工具FudanNLP的主要开发者邱锡鹏(http://nlp.fudan.edu.cn/xpqiu/)老师撰写的《神经网络与深度学习》书册,是国内为数不多的深度学习中文基础教程之一,每一章都是干货,非常精炼。邱老师在今年中国中文信息学会《前沿技术讲习班》做了题为《深度学习基础》的精彩报告,报告非常精彩,深入浅出地介绍了神经网络与深度学习的一系列相关知识,基本上围绕着邱老师的《神经网络与深度学习》一书进行讲解。专知希望把如此精华知识资料分发给更多AI从业者,
WZEARW
2018-04-10
2.7K0
【DeepMind 公开课-深度强化学习教程笔记04】不基于模型的预测
点击上方“专知”关注获取更多AI知识! 【导读】Google DeepMind在Nature上发表最新论文,介绍了迄今最强最新的版本AlphaGo Zero,不使用人类先验知识,使用纯强化学习,将价值网络和策略网络整合为一个架构,3天训练后就以100比0击败了上一版本的AlphaGo。Alpha Zero的背后核心技术是深度强化学习,为此,专知有幸邀请到叶强博士根据DeepMind AlphaGo的研究人员David Silver《深度强化学习》视频公开课进行创作的中文学习笔记,在专知发布推荐给大家!(关注
WZEARW
2018-04-10
1.1K0
【观点】Facebook人工智能组研究员田渊栋:关于AI的一些杂谈
来源:https://zhuanlan.zhihu.com/p/30750293 关于AlphaGo AlphaGo厉害的地方在于结合了工程和科研两方面的工作,通过大量计算资源和工程优化将一个方向推向了极致,并且同时借鉴了十年来大家在围棋上及在计算机视觉上的点滴进展,围棋和强化学习方向上像蒙特卡罗树搜索,自对弈(俗称“左右互搏”),随机走子盘面估值,用人工特征加浅层网络进行快速走子,权衡广度和深度搜索,权衡从头探索和先验知识,计算机视觉方向上像卷积神经网络(CNN),残差网络(ResNet),旋转翻折样本增
WZEARW
2018-04-09
6660
点击加载更多
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档