首页标签强化学习

#强化学习

强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。

绑手指、蒙布也能行,OpenAI让机器人单手还原魔方

机器之心

借助于手臂,人类可以完全各种各样的任务。而在机器人过去 60 年的发展历程中,人类通过双手可以完成各项复杂的任务,但却需要针对每项任务设计特定的机器人。

1120

2018年度腾讯犀牛鸟精英人才培养计划优秀学生成果分享(一)

腾讯高校合作

随着互联网的发展逐渐进入 “深水区”,基础研究与应用研究融通创新发展已引发业界广泛关注,协调产学各方资源,加速培养更多创新型研究人才变得尤为重要。腾讯自201...

3260

【干货】关于机器学习的知识点,全在这篇文章里了

zenRRan

导读:作者用超过1.2万字的篇幅,总结了自己学习机器学习过程中遇到知识点。“入门后,才知道机器学习的魅力与可怕。”希望正在阅读本文的你,也能在机器学习上学有所成...

5610

卡牌游戏八合一,华人团队开源强化学习研究平台RLCard

AI科技评论

具体来说,RLCard 实现了四种有代表性的强化学习算法:作为强化学习的代表算法的 DQN、作为带有自我学习的强化学习的代表算法的 NSFP、反事实后悔最小化 ...

5720

近5亿次捉迷藏游戏中,AI玩家策略轮番升级,花式使用工具!

大数据文摘

该实验基于该领域现有的两种思想:多智能体学习,即通过将多种算法进行竞争或协调以产生应急智能;以及强化学习,即一种在不断试验和纠错的过程中学习并实现目标的特定机器...

11020

一文看懂什么是强化学习?应用场景和主流算法

AINLP

机器人很像强化学习里的「代理」,在机器人领域,强化学习也可以发挥巨大的作用。(下面文章搜索即可找到)

6320

AI“贝多芬”诞生了?

AiTechYun

音乐是艺术,音乐也是一门生意。如今,音乐这门生意越发引起商业巨头的关注。曾经,各音乐平台比的是曲目数量,艺人进驻数量,后来则更看重独家版权。现在,以深度神经网络...

6830

DeepMind的人工智能系统学会了绘画

AiTechYun

Eslami的小组使用了一种称为强化学习的技术。在当今的大多数AI系统中,我们使用监督学习,在其中输入以某种方式标记的数据,以便系统可以将其结果与正确答案进行比...

7220

花最少的钱,训超6的机器人:谷歌大脑推出机器人强化学习平台,硬件代码全开源

量子位

机器人的设计都基于现成的组件和常用的原型制作工具(3D打印或激光切割),模块化,易于组装,易于维护。

5920

7 Papers | 李飞飞新论文;深度学习代码搜索综述;Adobe用GAN生成动画

机器之心

论文 1:SummAE: Zero-Shot Abstractive Text Summarization using Length-Agnostic Auto...

7760

兼顾公平与效率?北大NeurIPS 19论文提出多智能体强化学习方法FEN

机器之心

公平有助于人类社会的稳定和生产力的提高,同样对于多智能体系统也十分重要。然而让一组智能体学习提升系统效率并同时保持公平是一个复杂的、多目标的、联合策略优化问题。...

6450

机器学习|卷积神经网络(CNN) 手写体识别 (MNIST)入门

用户1737318

强化学习 (Reinforcement Learnong): 强化学习应当是机器学习当中最吸引人的一个部分了,例如 Gym 上就有很多训练电脑自己玩游戏最后拿高...

10120

卡牌游戏八合一,华人团队开源强化学习研究平台RLCard

AI研习社

具体来说,RLCard 实现了四种有代表性的强化学习算法:作为强化学习的代表算法的 DQN、作为带有自我学习的强化学习的代表算法的 NSFP、反事实后悔最小化 ...

8920

谷歌又出量子计算新成果,这次用上了深度强化学习!

AI科技评论

原标题:Improving Quantum Computation with Classical Machine Learning

5420

世界欠他一个图灵奖! LSTM之父的深度学习“奇迹之年”

数据派THU

导读 LSTM的发明人、著名深度学习专家Jürgen Schmidhuber详细论述了近30年前,即1990~1991年之间他和团队进行的许多研究。他们的早期思...

5020

DeepMind已经悄悄地开放了三个令人印象深刻的强化学习框架

AiTechYun

近年来,深度强化学习(DRL)一直是人工智能(AI)一些重大突破的核心。然而,尽管DRL方法取得了很大的进步,但由于缺少工具和库,它仍然难以应用于主流解决方案中...

6410

平价训练AI机器人:谷歌大脑&伯克利联合推出低成本机器人训练平台ROBEL

新智元

用于解决机器人控制问题的基于学习的方法最近有了显著的发展,这是由模拟基准(如dm_control或OpenAI-Gym)的广泛可用和灵活的、可扩展的强化学习技术...

6440

Nature发文:深度学习系统为什么这么好骗?

机器之心

这个问题不止在目标识别中出现:任何使用 DNN 对输入进行分类的 AI 都能被骗到,如使用强化学习的游戏 AI,在屏幕上随机添加几个像素就能让智能体输掉比赛。

6730

情感计算:让机器更加智能

机器之心

微软的研究者在这个问题上给出了自己的答案,他们提出了一种基于周围血管搏动测量(Peripheral Pulse Measurements)的内在奖励的强化学习新...

10830

Hands-on Machine Learning with Scikit-Learn and TensorFlow 学习笔记

AINLP

今天收到 Github 用户 Baymax(https://github.com/DeqianBai) 的投稿,他目前在哈工程读研,研究方向是强化学习,利用业余...

6700

扫码关注云+社区

领取腾讯云代金券