CreateAMind-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

CreateAMind

专栏成员

1002

文章

638907

阅读量

56

订阅数

忆阻器玩Atari游戏

函数内存网络硬件游戏

Single Neuromorphic Memristor closely Emulates Multiple Synaptic Mechanisms for Energy Efficient Neural Networks

2024-04-26

900

超越OpenAI，我们是认真的：几千步就能学习游戏玩法，参数是现有模型1%的新AGI

模型效率游戏 openai 测试

不列颠哥伦比亚省温哥华 / 2024 年 2 月 22 日 / VERSES AI Inc. (CBOE:VERS) (OTCQB:VRSSF)（“VERSES”或“公司”）是一家开发下一代智能软件系统的认知计算公司，今天提供了研究路线图概述了衡量公司研发工作的进展和重要性的关键里程碑和基准，与传统的深度学习相比，以造福工业界、学术界和公众。

2024-02-26

2040

一个框架整合大脑理论 7 三层智能：有目的的行为，精确同步外部世界

框架模型同步游戏编码

从动力系统的角度来看，这可以解读为广义同步的出现——或者混沌的同步——就像联合系统收敛于一个同步流形

2024-01-11

1810

世界模型仅用 1 小时训练一个四足机器人从头开始翻滚、站立和行走，无需重置。10 分钟内适应扰动或快速翻身站立

游戏机器人华为模型视频

DayDreamer: World Models for Physical Robot Learning

2023-09-01

2880

2000行AlphaZero算法通用简单快速实现

编程算法游戏

由于 AlphaZero 非常耗费资源，因此成功的开源实现（例如Leela Zero）是用低级语言（例如 C++）编写的，并针对高度分布式计算环境进行了优化。这使得学生、研究人员和黑客很难访问它们。

2023-02-14

3780

生命主动推理的数学描述

神经网络机器学习深度学习人工智能游戏

那些我们可以归类为“控制论的”、“适应性的”或“活的”的系统都显示出一个基本的属性 :它们抵制将它们推离目标或使它们的存在不可持续的扰动。为了做到这一点,这样的系统能够以某种方式感知它们当前的状态(通过感知)并做出适当的反应(通过行动)。在第一部分的系列论文中,我们试图为足以描述这种系统的主动推理理论提供新的组成基础,特别关注在组成神经科学和人工生命社区中被称为自由能原理的框架[1],我们试图使其结构精确。

2022-03-14

4150

组合游戏系列4: AlphaGo Zero 强化学习算法原理深度分析

神经网络游戏编程算法

AlphaGo Zero是Deepmind 最后一代AI围棋算法，因为已经达到了棋类游戏AI的终极目的：给定任何游戏规则，AI从零出发只通过自我对弈的方式提高，最终可以取得超越任何对手（包括顶级人类棋手和上一代AlphaGo）的能力。换种方式说，当给定足够多的时间和计算资源，可以取得无限逼近游戏真实解的能力。这一篇，我们深入分析AlphaGo Zero的设计理念和关键组件的细节并解释组件之间的关联。下一篇中，我们将在已有的N子棋OpenAI Gym 环境中用Pytorch实现一个简化版的AlphaGo Zero算法。

2020-10-22

1.5K0

Google Research Football (scenario 2) 实验

谷歌足球环境（Google Research Football ）的介绍可以参看之前的公众号文章：

2019-08-30

1.1K0

RND： https://blog.openai.com/reinforcement-learning-with-prediction-based-rewards/

2019-04-28

6670

巨量奇幻炫酷照片来袭 - 人工智能艺术照片赏析

人工智能神经网络游戏

神经网络在计算机视觉取得了巨大的发展，让我们在图片效果上面的想象力有了更好的展示方式，想象力从图片效果扩展开来，人类的想象力有了更好的表达。从场景到人物，从游戏到动漫，从可爱动物到奇幻森林，烈火浓烟效果滚滚，从稀奇古怪到恐怖科幻。各种效果等你来实现。

2018-07-25

3950

智能机器的现实风险

深度学习自动驾驶人工智能图像处理游戏

当人们问我是干什么的，我常常对回答的深度感到困惑。说“人工智能”我很满意，但太宽泛，而说“图像处理”可能又太具体。然而，一听到接下的来的毫不相干的问题我总是气不打一处来。

2018-07-25

2700

模拟赛车torcs论文翻译

游戏 .net 开源

摘要：本手册介绍了模拟赛车锦标赛的比赛软件，在进化计算领域和计算智能与游戏领域的大型会议上举办的国际比赛。它提供了架构的概述、安装软件的说明以及运行包中提供的简单驱动程序、传感器和执行器的描述。 1.介绍：本手册介绍了模拟赛车锦标赛的比赛软件，在进化计算领域和计算智能与游戏领域的大型会议上举办的国际比赛。比赛的目标是为赛车设计一个控制器，用于首次单独在未知轨道比赛中同其他赛车比赛。控制器通过多个传感器来感知赛车环境，这些传感器描述了汽车状态（燃料水平，发动机转速，当前档位等），汽车周围环境的

2018-07-24

1.5K0

Keras和DDPG玩赛车游戏（自动驾驶）

keras 游戏自动驾驶 python

这里，s是状态，a是行为/动作，θ是策略网络的模型参数，π是常见的表示策略的符号。我们可以设想策略是我们行为的代理人，即一个从状态到动作的映射函数。

2018-07-24

1.6K0

代码+视频 - 卡车强化学习自动驾驶模拟 - 玩游戏看风景

强化学习自动驾驶游戏 https

https://github.com/aleju/self-driving-truck

2018-07-24

4610

代码开源---强化学习赛车视频2

开源强化学习游戏人工智能

https://github.com/createamind/a3c333 更复杂参考README.md

2018-07-24

4290

代码+视频 - 卡车强化学习自动驾驶模拟 - 玩游戏看风景

强化学习自动驾驶游戏 https

https://github.com/aleju/self-driving-truck

2018-07-24

6410

AGI:我与世界的互动是不是如我所愿。动作条件CycleGAN好奇心探索代码开源

开源 ios 游戏 https

Curiosity-driven Exploration by Self-supervised Prediction

2018-07-24

3720

动作CycleGAN好奇心探索代码开源

开源 ios 游戏 https

Curiosity-driven Exploration by Self-supervised Prediction 一项好的勘探政策是允许代理人访问尽可能多的国家，即使没有任何目标。我们期望良好的勘探政策能够覆盖尽可能多的地图；我们期望它访问尽可能多的游戏状态。令我们吃惊的是，我们发现在这两种情况下，无奖励代理都能很好地执行报价(请参见视频)。 https://github.com/pathak22/noreward-rl https://pathak22.github.io/noreward-rl/

2018-07-20

3090

AGI:我与世界的互动是不是如我所愿。动作条件CycleGAN好奇心探索代码开源

开源 ios 游戏 https

Curiosity-driven Exploration by Self-supervised Prediction 一项好的勘探政策是允许代理人访问尽可能多的国家，即使没有任何目标。我们期望良好的勘探政策能够覆盖尽可能多的地图；我们期望它访问尽可能多的游戏状态。令我们吃惊的是，我们发现在这两种情况下，无奖励代理都能很好地执行(请参见视频)。 https://github.com/pathak22/noreward-rl https://pathak22.github.io/noreward-rl/ r

2018-07-20

4310

深度神经网络惊人的'注意力'能力-附论文解读

神经网络游戏

深度网络在计算机视觉、语言、翻译、玩游戏等等方面都取得了巨大的进步，在动物的注意力方面也开始逐步取得进展！看图： paper 《Top-down Neural Attention by Excita

2018-07-20

4860

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态