首页
学习
活动
专区
工具
TVP
发布

CreateAMind

专栏成员
1002
文章
637693
阅读量
56
订阅数
忆阻器玩Atari游戏
Single Neuromorphic Memristor closely Emulates Multiple Synaptic Mechanisms for Energy Efficient Neural Networks
CreateAMind
2024-04-26
880
超越OpenAI,我们是认真的:几千步就能学习游戏玩法,参数是现有模型1%的新AGI
不列颠哥伦比亚省温哥华 / 2024 年 2 月 22 日 / VERSES AI Inc. (CBOE:VERS) (OTCQB:VRSSF)(“VERSES”或“公司”)是一家开发下一代智能软件系统的认知计算公司,今天提供了研究路线图概述了衡量公司研发工作的进展和重要性的关键里程碑和基准,与传统的深度学习相比,以造福工业界、学术界和公众。
CreateAMind
2024-02-26
2040
一个框架整合大脑理论 7 三层智能:有目的的行为,精确同步外部世界
从动力系统的角度来看,这可以解读为广义同步的出现——或者混沌的同步——就像联合系统收敛于一个同步流形
CreateAMind
2024-01-11
1800
世界模型仅用 1 小时训练一个四足机器人从头开始翻滚、站立和行走,无需重置。10 分钟内适应扰动或快速翻身站立
DayDreamer: World Models for Physical Robot Learning
CreateAMind
2023-09-01
2870
2000行AlphaZero算法通用简单快速实现
由于 AlphaZero 非常耗费资源,因此成功的开源实现(例如Leela Zero)是用低级语言(例如 C++)编写的,并针对高度分布式计算环境进行了优化。这使得学生、研究人员和黑客很难访问它们。
CreateAMind
2023-02-14
3730
生命主动推理的数学描述
那些我们可以归类为“控制论的”、“适应性的”或“活的”的系统都显示出一个基本的属性 :它们抵制将它们推离目标或使它们的存在不可持续的扰动。为了做到这一点,这样的系统能够以某种方式感知它们当前的状态(通过感知)并做出适当的反应(通过行动)。在第一部分的系列论文中,我们试图为足以描述这种系统的主动推理理论提供新的组成基础,特别关注在组成神经科学和人工生命社区中被称为自由能原理的框架[1],我们试图使其结构精确。
CreateAMind
2022-03-14
4140
组合游戏系列4: AlphaGo Zero 强化学习算法原理深度分析
AlphaGo Zero是Deepmind 最后一代AI围棋算法,因为已经达到了棋类游戏AI的终极目的:给定任何游戏规则,AI从零出发只通过自我对弈的方式提高,最终可以取得超越任何对手(包括顶级人类棋手和上一代AlphaGo)的能力。换种方式说,当给定足够多的时间和计算资源,可以取得无限逼近游戏真实解的能力。这一篇,我们深入分析AlphaGo Zero的设计理念和关键组件的细节并解释组件之间的关联。下一篇中,我们将在已有的N子棋OpenAI Gym 环境中用Pytorch实现一个简化版的AlphaGo Zero算法。
CreateAMind
2020-10-22
1.5K0
Google Research Football (scenario 2) 实验
谷歌足球环境(Google Research Football )的介绍可以参看之前的公众号文章:
CreateAMind
2019-08-30
1.1K0
RND 笔记
RND: https://blog.openai.com/reinforcement-learning-with-prediction-based-rewards/
CreateAMind
2019-04-28
6650
巨量奇幻炫酷照片来袭 - 人工智能艺术照片赏析
神经网络在计算机视觉取得了巨大的发展,让我们在图片效果上面的想象力有了更好的展示方式,想象力从图片效果扩展开来,人类的想象力有了更好的表达。从场景到人物,从游戏到动漫,从可爱动物到奇幻森林,烈火浓烟效果滚滚,从稀奇古怪到恐怖科幻。各种效果等你来实现。
CreateAMind
2018-07-25
3950
智能机器的现实风险
当人们问我是干什么的,我常常对回答的深度感到困惑。说“人工智能”我很满意,但太宽泛,而说“图像处理”可能又太具体。然而,一听到接下的来的毫不相干的问题我总是气不打一处来。
CreateAMind
2018-07-25
2700
模拟赛车torcs论文翻译
摘要:本手册介绍了模拟赛车锦标赛的比赛软件,在进化计算领域和计算智能与游戏领域的大型会议上举办的国际比赛。 它提供了架构的概述、安装软件的说明以及运行包中提供的简单驱动程序、传感器和执行器的描述。 1.介绍: 本手册介绍了模拟赛车锦标赛的比赛软件,在进化计算领域和计算智能与游戏领域的大型会议上举办的国际比赛。 比赛的目标是为赛车设计一个控制器,用于首次单独在未知轨道比赛中同其他赛车比赛。 控制器通过多个传感器来感知赛车环境,这些传感器描述了汽车状态(燃料水平,发动机转速,当前档位等),汽车周围环境的
CreateAMind
2018-07-24
1.5K0
Keras和DDPG玩赛车游戏(自动驾驶)
这里,s是状态,a是行为/动作,θ是策略网络的模型参数,π是常见的表示策略的符号。我们可以设想策略是我们行为的代理人,即一个从状态到动作的映射函数。
CreateAMind
2018-07-24
1.6K0
代码+视频 - 卡车强化学习自动驾驶模拟 - 玩游戏看风景
https://github.com/aleju/self-driving-truck
CreateAMind
2018-07-24
4610
代码开源---强化学习赛车视频2
https://github.com/createamind/a3c333 更复杂 参考README.md
CreateAMind
2018-07-24
4290
代码+视频 - 卡车强化学习自动驾驶模拟 - 玩游戏看风景
https://github.com/aleju/self-driving-truck
CreateAMind
2018-07-24
6390
AGI:我与世界的互动是不是如我所愿。动作条件CycleGAN好奇心探索 代码开源
Curiosity-driven Exploration by Self-supervised Prediction
CreateAMind
2018-07-24
3720
动作CycleGAN好奇心探索 代码开源
Curiosity-driven Exploration by Self-supervised Prediction 一项好的勘探政策是允许代理人访问尽可能多的国家,即使没有任何目标。我们期望良好的勘探政策能够覆盖尽可能多的地图;我们期望它访问尽可能多的游戏状态。令我们吃惊的是,我们发现在这两种情况下,无奖励代理都能很好地执行报价(请参见视频)。 https://github.com/pathak22/noreward-rl https://pathak22.github.io/noreward-rl/
CreateAMind
2018-07-20
3080
AGI:我与世界的互动是不是如我所愿。动作条件CycleGAN好奇心探索 代码开源
Curiosity-driven Exploration by Self-supervised Prediction 一项好的勘探政策是允许代理人访问尽可能多的国家,即使没有任何目标。我们期望良好的勘探政策能够覆盖尽可能多的地图;我们期望它访问尽可能多的游戏状态。令我们吃惊的是,我们发现在这两种情况下,无奖励代理都能很好地执行(请参见视频)。 https://github.com/pathak22/noreward-rl https://pathak22.github.io/noreward-rl/ r
CreateAMind
2018-07-20
4310
深度神经网络惊人的'注意力'能力-附论文解读
深度网络在计算机视觉、语言、翻译、玩游戏等等方面都取得了巨大的进步,在动物的注意力方面也开始逐步取得进展! 看图: paper 《Top-down Neural Attention by Excita
CreateAMind
2018-07-20
4840
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档