用户1908973

LV0
发表了文章

How We Learn第八章 婴儿有元认知能力吗?(含认知案例)

带两只小猫。给第一只套上项圈和皮带。把第二个放在⻢具上。最后,把它们连接到一个旋转木⻢上,确保两只小猫的动作紧密相连。这个想法是,这两只动物接受相同的视觉输入,...

用户1908973
发表了文章

How We Learn第七章 注意力的How What When 及抑制和训练 (长文+案例)

仅仅突触可塑性的存在不足以解释我们物种的非凡成功。事实上,这种可塑性在动物世界中无处不在:即使是家蝇、线虫和海蛞蝓也有可修改的突触。如果智人变成了智人,如果学习...

用户1908973
发表了文章

how we learn 第五章节选 记忆 学习的物质基础:营养对突触可塑的支持极限 (长文)

我刚刚坚持了大自然对我们大脑构造的贡献——基因和自组织的相互作用。但是, 当然,养育也同样重要。大脑的早期组织并不是永远不变的:经验提炼并丰富了它。这是硬币的另...

用户1908973
发表了文章

How We Learn第六章 艾伦·图灵的经验主义观点如何被反驳?

让我们总结一下到目前为止我们所涵盖的内容。空白板假设显然是错误的:婴儿出生时就有相当多的核心知识,一套丰富的关于他们以后将会遇到的环境的普遍假设。他们的大脑回路...

用户1908973
发表了文章

how we learn part2 第三章 婴儿全面的内在知识 金句

当机器配备有两个特征时,学习会更加有效:一个巨大的假设空间,一组有无数设置可供选择的心智模型;和复杂的算法,根据从外部世界接收的数据调整这些设置。在关于先天和后...

用户1908973
发表了文章

how we learn 第四章 新生大脑 金句

新生婴儿立即表现出对物体、数字、人和语言的复杂知识,这一事实驳斥了这样的假设,即他们的大脑只不过是吸收环境强加给他们的任何东⻄的空白板、海绵。一个简单的预测随之...

用户1908973
发表了文章

how we learn 第二章 人脑比机器强在哪?(长文)

对人工神经网络的一个常⻅批评是,它们试图在同一水平上学习一切,好像每个问题都是自动分类的问题。对一个拿着锤子的人来说,一切看起来都像钉子!但是我们的大脑灵活多了...

用户1908973
发表了文章

how we learn 学习笔记 2 学习的七个定义

这些心智模型的丰富性,在很大程度上是无意识的,超出了我们的想象。例如,你拥有一个巨大的语言思维模型,身体模型,各种外部交互模型(游戏、手机),

用户1908973
发表了文章

how we learn 学习笔记 1 AI方向预测

我们大脑的认知能力如何抵御环境的创伤,剧烈的大脑创伤后的变化(作者举例失明小孩的写作经历)?鉴于我们截然不同的感官体验,为什么菲利普和我会有相同的想法?不同的人...

用户1908973
发表了文章

人脑模型理论:千脑一书的精华脑图笔记

链接: https://pan.baidu.com/s/1FhqmTfYVO5SQteDC_BcAmA 提取码: 7u4t

用户1908973
发表了文章

3.2出版的英文AGI 新书简介--宏伟科幻般的分析

试读:https://www.amazon.com/Thousand-Brains-New-Theory-Intelligence/dp/1541675819/

用户1908973
发表了文章

动画模拟统计随机变量生成器:离散基础篇

本公众号MyEncyclopedia定期发布AI,算法,工程类深度和前沿文章。学习本文的最佳姿势为点击文末在看,发送本文链接到桌面版浏览器,打开文末阅读原文,敲...

用户1908973
发表了文章

强化学习开源环境集(魂斗罗,星际争霸,斗地主,自动驾驶都有哦)

OpenAI 发布的增强的游戏强化学习研究平台,Gym Retro。其中包括对任天堂 Game boy,NES, 世嘉游戏等各种模拟器的支持。通过附带的 Int...

用户1908973
发表了文章

Jane Street Market Prediction 排名前10的notebook分享

https://www.kaggle.com/c/jane-street-market-prediction/leaderboard

用户1908973
发表了文章

解读深度强化学习基石论文:函数近似的策略梯度方法

导读:这篇是1999 年Richard Sutton 在强化学习领域中的经典论文,论文证明了策略梯度定理和在用函数近似 Q 值时策略梯度定理依然成立,本论文奠...

用户1908973
发表了文章

深度强化学习之:Policy Gradient Theorem 综述

Policy gradient 定理作为现代深度强化学习的基石,同时也是actor-critic的基础,重要性不言而喻。但是它的推导和理解不是那么浅显,不同的资...

用户1908973
发表了文章

通过代码学Sutton强化学习第四章动态规划

经典教材Reinforcement Learning: An Introduction 第二版由强化领域权威Richard S. Sutton 和 Andrew...

用户1908973
发表了文章

组合游戏系列4: AlphaGo Zero 强化学习算法原理深度分析

AlphaGo Zero是Deepmind 最后一代AI围棋算法,因为已经达到了棋类游戏AI的终极目的:给定任何游戏规则,AI从零出发只通过自我对弈的方式提高,...

用户1908973
发表了文章

Soft Reinforcement Learning 介绍

Soft Reinforcement Learning (SRL) 是强化学习的一个新的范式,脱胎于最大熵强化学习 (Maximum Entropy Reinf...

用户1908973
发表了文章

Qzero算法介绍

1. AlphaZero算法: 算法的核心是把MCTS算法与深度强化学习(DRL)结合起来(使用MCTS算法作为RL的policy improvement机制)...

用户1908973

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券