杨熹的专栏

210 篇文章
38 人订阅

全部文章

杨熹

用一个小游戏入门深度强化学习

今天我们来用深度强化学习算法 deep Q-learning 玩 CartPole 游戏。

491
杨熹

什么是 Q-learning

在这个游戏中,agent 从一个给定的位置开始,即起始状态。 在不穿越迷宫墙壁的前提下,在每个状态时,都可以选择上下左右四个方向走一步,或者原地不动, 上下...

742
杨熹

权重初始化的几个方法

其中第一步 权重的初始化 对模型的训练速度和准确性起着重要的作用,所以需要正确地进行初始化。

652
杨熹

为什么在优化算法中使用指数加权平均

指数加权平均(exponentially weighted averges),也叫指数加权移动平均,是一种常用的序列数据处理方式。

461
杨熹

为什么需要 Mini-batch 梯度下降,及 TensorFlow 应用举例

里面对 BGD,SGD,MBGD,Adagrad,Adadelta,RMSprop,Adam 进行了比较, 今天对其中的 mini-batch 梯度下降 作进...

581
杨熹

梯度消失问题与如何选择激活函数

当我们在做反向传播,计算损失函数对权重的梯度时,随着越向后传播,梯度变得越来越小,这就意味着在网络的前面一些层的神经元,会比后面的训练的要慢很多,甚至不会变化。

863
杨熹

cs230 深度学习 Lecture 2 编程作业: Logistic Regression with a Neural Network mindset

1262
杨熹

用 TensorFlow.js 在浏览器中训练神经网络

1543
杨熹

Logistic regression 为什么用 sigmoid ?

1193
杨熹

LightGBM 如何调参

3304
杨熹

AI 在 marketing 上的应用

1863
杨熹

Logistic Regression 为什么用极大似然函数

1922
杨熹

SVM 的核函数选择和调参

2255
杨熹

读书|《推荐系统实践》

1583
杨熹

Kaggle winner 方案 | Instacart Market Basket Analysis: 2nd place

今天来看看 Instacart Market Basket Analysis competition 的第二名方案,作者是 Yahoo! JAPAN 的一个数...

3215
杨熹

Kaggle winner 方案简介 | Understanding the Amazon from Space: 1st place

Below is a brief introduction of the 1st place winner solution to the competitio...

3538
杨熹

论文 | AlphaGo Zero 的模型和算法

上一篇文章简单学习了 AlphaGo Zero 的特点: AlphaGo Zero 初探 http://www.jianshu.com/u/7b67af2e6...

34311
杨熹

几种简单的文本数据预处理方法

本文将介绍几种简单的文本数据预处理方法,希望与大家共同学习分享。

2914
杨熹

读书|《Mastering Machine Learning with Python in Six Steps》

蜗牛最近精力真是有限,很快就要大考了,不过读书不能停。 接下来几天读一读 《Mastering Machine Learning with Python in ...

34010
杨熹

思考力|《零秒思考》

遇到问题,有些人能够瞬间给出解决方案,有些人却要很多时间去思考。 这本书可以帮助训练思考力。 本文结构: 1. 方法操作 2. 掌握关键点是什么 3. ...

3576

扫码关注云+社区