LV1

刘建平Pinard

http://www.cnblogs.com/pinard
  • 广东省 · 广州市
  • 唯品会 · 资深开发工程师

    唯品会 · 资深开发工程师 (已认证)

展开详细资料

动态

XGBoost类库使用小结

952

机器学习中的矩阵向量求导(五) 矩阵对矩阵的求导

852

机器学习中的矩阵向量求导(三) 矩阵向量求导之微分法

1072

机器学习中的矩阵向量求导(一) 求导定义与求导布局

972

机器学习中的矩阵向量求导(二) 矩阵向量求导之定义法

712

强化学习(十九) AlphaGo Zero强化学习原理

1885

强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)

933

强化学习(十五) A3C

1311

强化学习(十六) 深度确定性策略梯度(DDPG)

5954

强化学习(十七) 基于模型的强化学习与Dyna算法框架

1442

强化学习(十四) Actor-Critic

1652

强化学习(十三) 策略梯度(Policy Gradient)

1421

强化学习(十二) Dueling DQN

1703

强化学习(十一) Prioritized Replay DQN

2144

强化学习(十)Double DQN (DDQN)

3782

扫码关注云+社区

领取腾讯云代金券