首页
学习
活动
专区
工具
TVP
发布

相约机器人

专栏作者
664
文章
1031541
阅读量
52
订阅数
DeepMind的新强化学习系统是迈向通用AI的下一步吗?
对于精通围棋、星际争霸 2 以及其他游戏的深度强化学习模型而言,关键的挑战之一是它们无法将其能力泛化到训练领域之外。这种限制使得将这些系统应用到现实世界中变得非常困难,在现实世界中,情况比训练 AI 模型的环境复杂得多且不可预测。
代码医生工作室
2021-09-30
3540
用动画在老黄的厨房搞小动作?「AI Tuber」除了配音还能编曲?这次除了显卡都是干货
英伟达终于发布了GeForce RTX 3080 Ti,然而这一点儿都不重要。看完之后发现明显是那个「AITuber」旁白更有意思,是真的可爱!
代码医生工作室
2021-06-15
7370
用AI「驯服」人类幼崽:这个奶爸找到了硬核带娃的乐趣
长期以来,「奶爸」+「萌娃」一直是一个不被看好的组合,甚至有人说,「父爱如山体滑坡」。不信的话,以下都是证据:
代码医生工作室
2021-01-14
8310
如何教电脑玩Spot it!使用OpenCV和深度学习
爱好是玩棋盘游戏,因为对CNN有所了解,所以决定开发一种可以在纸牌游戏中击败人类的应用程序。想使用我自己的数据集从头开始构建模型,以查看使用小数据集从头开始的模型的性能如何。选择从一个不太难的游戏入手!(又称Dobble)。
代码医生工作室
2020-05-09
8300
DeepMind 一次性开源 3 个新框架
深度强化学习(Deep Reinforcement Learning,DRL)一直是近年来人工智能的一些重大突破的核心。然而,尽管 DRL 有了很大的进步,但由于缺乏工具和库,DRL 方法在主流解决方案中仍然难以应用。因此,DRL 仍然主要是以研究形式存在,并没有在现实世界看到许多采用机器学习的应用方案;而解决这个问题就需要更好的工具和框架。
代码医生工作室
2019-09-25
8400
17种深度强化学习算法用Pytorch实现
深度强化学习已经在许多领域取得了瞩目的成就,并且仍是各大领域受热捧的方向之一。本文推荐一个包含了 17 种深度强化学习算法实现的 PyTorch 代码库。
代码医生工作室
2019-09-17
2.1K0
从头开始编写一个强化学习足球经纪人!
欢迎来到数学和代码turorial系列的第一部分。展示如何实施一种称为近端策略优化(PPO)的强化学习算法,用于教授AI代理如何踢足球/足球。在本教程结束时,将了解如何在演员评论框架中应用on-policy学习方法,以便学习导航任何游戏环境。将在PPO算法的上下文中看到这些术语的含义,并在Keras的帮助下在Python中实现它们。所以首先开始安装游戏环境。
代码医生工作室
2019-08-15
1K0
权力的游戏使用Tensorflow中的LSTM和Recurrent单元生成剧集脚本
权力的游戏第8季确实令人失望,似乎导演无法学习前几季的模式,但担心的是,LSTM从不会错过任何模式,并会帮助提供一个更好的脚本,一个AI生成的脚本。
代码医生工作室
2019-08-09
5900
腾讯AI制霸王者荣耀,世界杯5V5 「绝悟」绝杀职业玩家,1天训练强度超人类440年
昨日,腾讯AI Lab研发的智能体「绝悟」在王者荣耀世界冠军杯半决赛特设环节,与职业选手职业选手赛区联队的5v5对决中获胜!
代码医生工作室
2019-08-06
6980
创建自动滑雪模拟器
关于自治代理,它们的应用和改进,有很多研究。所以在考虑自动驾驶汽车,它可以在没有任何碰撞的情况下在雪地上行驶。不幸的是,没有足够的资源和时间来构建一个真正的机器人,其中有特殊的硬件可以在雪地上行驶。所以决定在模拟器上运行我的实验。
代码医生工作室
2019-07-16
6410
50 行代码教 AI 实现动作平衡 | 附完整代码
【CSDN 编者按】本文将为大家展示如何通过 Numpy 库和 50行 Python 代码,使用标准的 OpenAI Gym平台创建智能体 (Agent),就教会机器处理推车杆问题 (Cart Pole Problem) ,保持平衡。
代码医生工作室
2019-06-21
7160
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档