Steve Wang

LV4
  • 云+社区翻译社勋章: LV 4

发表了文章

Policy Gradient 算法

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明...

Steve Wang
发表了文章

Monte Carlo Tree Search (MCTS) 蒙特·卡罗尔树搜索

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明...

Steve Wang
监督学习
发表了文章

Imitation Learning 模仿学习

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

Steve Wang
强化学习监督学习
发表了文章

Deep Q learning: DQN及其改进

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

Steve Wang
发表了文章

Planning and Learning

这算是一篇综述性文章,讲的不深,但是了解做planning都有哪些方法。这篇文章里全部使用了Q的说法,因为实现上可能是网络DQN,也可以是经典的Table。

Steve Wang
编程算法
发表了文章

CNNs and Deep Q Learning

前面的一篇博文介绍了函数价值近似,是以简单的线性函数来做的,这篇博文介绍使用深度神经网络来做函数近似,也就是Deep RL。这篇博文前半部分介绍DNN、CNN...

Steve Wang
机器学习神经网络深度学习AI 人工智能
订阅了专栏

腾讯云自媒体分享计划

2 文章2.5K 关注者
关注了用户

腾讯云自媒体分享计划

腾讯 · 产品运营 (已认证)

申请条件:至少有 20 篇或以上符合投稿要求可迁入腾讯云专栏的原创技术文章。

2 文章0 回答2.5K 关注者
发表了文章

Value function approximation

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

Steve Wang
发表了文章

从SARSA算法到Q-learning with ϵ-greedy Exploration算法

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

Steve Wang
发表了文章

ϵ-greedy Policies

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

Steve Wang
编程算法
发表了文章

Importance Sampling 重要性采样

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

Steve Wang
发表了文章

Monte Carlo Off Policy Evaluation

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

Steve Wang
发表了文章

Model-Free Control

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

Steve Wang
发表了文章

KBQA: 知识图谱上的问答系统概述

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...

Steve Wang
知识图谱自然语言自然语言处理编程算法

个人简介

个人成就

  • 已成为翻译社成员
    • 云+社区翻译社勋章: LV 4

  • 获得 1.5K 次赞同
  • 文章被阅读 74.6K 次

扫码关注云+社区

领取腾讯云代金券