腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

进击的Coder

专栏作者

552

文章

1250834

阅读量

199

订阅数

人工神经网络真的像神经元一样工作吗？

神经网络机器学习深度学习人工智能强化学习

人工神经网络和机器学习已经成为大众媒体的热门主题。智能机器这一想法勾起了很多人的想象，而且人们特别喜欢把它和人类放一起比较。特别是有一个关于人工智能的底层机制的基础问题经常出现——这些人工神经网络的工作方式真的和我们大脑中的神经元相似吗？

2019-09-04

1.1K0

一文解析OpenAI Five，一个会打团战的Dota2 AI

游戏强化学习

去年，OpenAI的强化学习bot在中路solo中击败职业选手Dendi，赢得众人瞩目，但Dota2是一个5人游戏，在那之后，我们目标是制作一个由神经网络构成的5人团队，它能在8月份举办的Ti8国际邀请赛上，用有限的英雄击败职业队。时至今日，我们有了OpenAI Five，它已经可以在比赛中击败业余玩家。

2019-09-04

1.8K0

强化学习之蒙特卡洛方法介绍

强化学习编程算法

在强化学习问题中，我们可以用马尔可夫决策过程（MDP）和相关算法找出最优行动值函数 q∗(s,a)和v∗(s)，它通过策略迭代和值迭代找出最佳策略。

2019-09-04

1.5K0

BGAN：支持离散值、提升训练稳定性的新GAN训练方法

神经网络机器学习深度学习人工智能强化学习

首先，让我们温习一下GAN（对抗生成网络）的概念。简单来说，GAN是要生成“以假乱真”的样本。这个“以假乱真”，用形式化的语言来说，就是假定我们有一个模型G（生成网络），该模型的参数为θ，我们要找到最优的参数θ，使得模型G生成的样本的概率分布Qθ与真实数据的概率分布P尽可能接近。即：

2019-09-04

1.9K0

浅谈强化学习的方法及学习路线

强化学习人工智能编程算法开源 python

介绍目前，对于全球科学家而言，“如何去学习一种新技能”成为了一个最基本的研究问题。为什么要解决这个问题的初衷是显而易见的，如果我们理解了这个问题，那么我们可以使人类做一些我们以前可能没有想到的事。或者，我们可以训练去做更多的“人类”工作，常遭一个真正的人工智能时代。虽然，对于上述问题，我们目前还没有一个完整的答案去解释，但是有一些事情是可以理解的。先不考虑技能的学习，我们首先需要与环境进行交互。无论我们是学习驾驶汽车还是婴儿学习走路，学习都是基于和环境的相互交互。从互动中学习是所有智力发展和学习理论

2018-06-25

9530

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态