腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
进击的Coder
专栏作者
举报
552
文章
1250834
阅读量
199
订阅数
订阅专栏
申请加入专栏
全部文章
python
爬虫
编程算法
https
网络安全
github
深度学习
神经网络
网站
开源
git
javascript
scrapy
人工智能
数据库
api
机器学习
http
java
分布式
其他
html
ide
容器镜像服务
大数据
windows
tensorflow
云数据库 Redis
linux
selenium
tcp/ip
sql
存储
安全
数据分析
NLP 服务
android
微信
mongodb
numpy
c++
php
go
css
ajax
apache
腾讯云测试服务
shell
云数据库 SQL Server
matlab
容器
ssh
微服务
官方文档
ios
vue.js
json
缓存
dns
打包
搜索引擎
ubuntu
文件存储
强化学习
迁移学习
bash
node.js
unix
nginx
云直播
卷积神经网络
正则表达式
keras
单元测试
数据结构
计算机
iphone
react
apt-get
日志服务
命令行工具
图像处理
电商
webpack
kubernetes
游戏
自动化
ftp
自动化测试
腾讯云开发者社区
验证码
云服务器
DNS 解析 DNSPod
腾讯云学堂
区块链
mac os
硬件开发
sqlite
nosql
django
eclipse
bash 指令
批量计算
访问管理
云数据库 MongoDB
SSL 证书
数据加密服务
es 2
企业
svg
xslt & xpath
黑客
gui
推荐系统
socket编程
数据处理
数据可视化
架构设计
jupyter notebook
sdk
云课堂
bug
title
云镜(主机安全)
对象存储
人脸识别
创业扶持
比特币
scala
xml
postgresql
web.py
tomcat
中文分词
tornado
容器服务
短视频
海外加速
消息队列 CMQ 版
天御验证码
腾讯git代码托管(工蜂)
文字识别
声纹识别
短信
DevOps 解决方案
渲染
数据安全
electron
express
运维
压力测试
spark
jdk
图像识别
hive
erp
监督学习
线性回归
openstack
seo
kotlin
pytorch
markdown
rpc
udp
敏捷开发
jenkins
hexo
ntp
anaconda
powershell
机器人
安全漏洞
element ui
nest
信息流
云计算
kafka
聚类算法
unicode
ascii
互动白板
rust
接口测试
性能测试
实时监控
程序人生
腾讯云图数据可视化
Elasticsearch Service
数据湖分析
数据湖
axis
bind
data
dom
get
i18n
localization
max
mean
model
pipeline
reshape
response
sh
编译
程序员
存储过程
对象
二维码
函数
视频
数据
虚拟机
语法
注解
搜索文章
搜索
搜索
关闭
人工神经网络真的像神经元一样工作吗?
神经网络
机器学习
深度学习
人工智能
强化学习
人工神经网络和机器学习已经成为大众媒体的热门主题。智能机器这一想法勾起了很多人的想象,而且人们特别喜欢把它和人类放一起比较。特别是有一个关于人工智能的底层机制的基础问题经常出现——这些人工神经网络的工作方式真的和我们大脑中的神经元相似吗?
崔庆才
2019-09-04
1.1K
0
一文解析OpenAI Five,一个会打团战的Dota2 AI
游戏
强化学习
去年,OpenAI的强化学习bot在中路solo中击败职业选手Dendi,赢得众人瞩目,但Dota2是一个5人游戏,在那之后,我们目标是制作一个由神经网络构成的5人团队,它能在8月份举办的Ti8国际邀请赛上,用有限的英雄击败职业队。时至今日,我们有了OpenAI Five,它已经可以在比赛中击败业余玩家。
崔庆才
2019-09-04
1.8K
0
强化学习之蒙特卡洛方法介绍
强化学习
编程算法
在强化学习问题中,我们可以用马尔可夫决策过程(MDP)和相关算法找出最优行动值函数 q∗(s,a)和v∗(s),它通过策略迭代和值迭代找出最佳策略。
崔庆才
2019-09-04
1.5K
0
BGAN:支持离散值、提升训练稳定性的新GAN训练方法
神经网络
机器学习
深度学习
人工智能
强化学习
首先,让我们温习一下GAN(对抗生成网络)的概念。简单来说,GAN是要生成“以假乱真”的样本。这个“以假乱真”,用形式化的语言来说,就是假定我们有一个模型G(生成网络),该模型的参数为θ,我们要找到最优的参数θ,使得模型G生成的样本的概率分布Qθ与真实数据的概率分布P尽可能接近。即:
崔庆才
2019-09-04
1.9K
0
浅谈强化学习的方法及学习路线
强化学习
人工智能
编程算法
开源
python
介绍 目前,对于全球科学家而言,“如何去学习一种新技能”成为了一个最基本的研究问题。为什么要解决这个问题的初衷是显而易见的,如果我们理解了这个问题,那么我们可以使人类做一些我们以前可能没有想到的事。或者,我们可以训练去做更多的“人类”工作,常遭一个真正的人工智能时代。 虽然,对于上述问题,我们目前还没有一个完整的答案去解释,但是有一些事情是可以理解的。先不考虑技能的学习,我们首先需要与环境进行交互。无论我们是学习驾驶汽车还是婴儿学习走路,学习都是基于和环境的相互交互。从互动中学习是所有智力发展和学习理论
崔庆才
2018-06-25
953
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档