首页
学习
活动
专区
工具
TVP
发布

IT派

专栏成员
703
文章
755154
阅读量
68
订阅数
备战世界杯!先用深度学习与强化学习踢场 FIFA 18
构建能玩 FIFA 游戏的智能体与游戏内置的 Bot 是不一样的,它不能访问任何内部程序信息,只能与人一样获得屏幕的输出信息。游戏窗口截图就是所有需要馈送到智能体游戏引擎的数据,智能体会处理这些视觉信息并输出它希望采取的动作,最后这些动作通过按键模拟器传递到游戏中。
IT派
2018-08-10
2910
DeepMind发表Nature子刊新论文:连接多巴胺与元强化学习的新方法
近期,AI 系统已经掌握多种视频游戏(例如 Atari 的经典游戏 Breakout 和 Pong)的玩法。虽然其表现令人印象深刻,但 AI 仍然依赖于数千小时的游戏经验才能达到并超越人类玩家的表现。而人类仅需数分钟就可以掌握视频游戏的基本玩法。
IT派
2018-07-30
2870
强化学习入门介绍
导语:近年以来,强化学习在人工智能所充当的角色越来越重要了,很多研究机构和大学都将强化学习与深度学习相结合打造高性能的系统。因此,本文注重描述强化学习的基本概念与实现,希望能为读者介绍这一机器学习分支的巨大魅力。 (文末有资源分享) 强化学习其实也是机器学习的一个分支,但是它与我们常见监督学习和无监督学习又不太一样。强化学习旨在选择最优决策,它讲究在一系列的情景之下,通过多步恰当的决策来达到一个目标,是一种序列多步决策的问题。该学习算法能帮助我们公式化表达生物体以奖励为动机(reward-motivate
IT派
2018-03-29
7880
从零开始:手把手教你安装深度学习操作系统、驱动和各种python库!
为了研究强化学习,最近购置了一台基于 Ubuntu 和英伟达 GPU 的深度学习机器。尽管目前在网络中能找到一些环境部署指南,但目前仍然没有全面的安装说明。另外,我也不得不阅读了很多文档来试图理解安装细节——其中的一些并不完整,甚至包含语法错误。本文试图提供一个详尽的软件环境安装指南。 操作系统(Ubuntu) 4 种驱动和库(GPU 驱动、CUDA、cuDNN 和 pip) 5 种 Python 深度学习库(TensorFlow、Theano、CNTK、Keras 和 PyTorch) 这些软件之间的互
IT派
2018-03-28
1.6K0
从强化学习基本概念到Q学习的实现,打造自己的迷宫智能体
导语:近年以来,强化学习在人工智能所充当的角色越来越重要了,很多研究机构和大学都将强化学习与深度学习相结合打造高性能的系统。因此,本文注重描述强化学习的基本概念与实现,希望能为读者介绍这一机器学习分支的巨大魅力。 强化学习其实也是机器学习的一个分支,但是它与我们常见监督学习和无监督学习又不太一样。强化学习旨在选择最优决策,它讲究在一系列的情景之下,通过多步恰当的决策来达到一个目标,是一种序列多步决策的问题。该学习算法能帮助我们公式化表达生物体以奖励为动机(reward-motivated)的行为。比如说,让
IT派
2018-03-28
8900
最新|Yann LeCun:大脑如何高效率学习?
IT派
2018-03-28
5560
这么多编程语言,而我为什么要学 Python?
今天分享的4个关于Python编程语言的故事,来看看人工智能时代爆发的Python。 每个人都知道Python是“AI时代最好的编程语言”。 言归正传,我们到底该不该选择Python? #1 如果想
IT派
2018-03-28
1.5K0
2017年机器学习几大主要进展汇总!
摘要: 2017年注定是机器学习快速发展的一年,特别是机器学习商业化的成功是的更多的人积极的投入到机器学习的学习当中。机器学习一定会成为未来的技术,让我们看看这项未来的技术现在发展到何种程度。 很难
IT派
2018-03-28
9040
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档