首页
学习
活动
专区
工具
TVP
发布

杨熹的专栏

专栏成员
302
文章
379294
阅读量
55
订阅数
什么是 Q-learning
在这个游戏中,agent 从一个给定的位置开始,即起始状态。 在不穿越迷宫墙壁的前提下,在每个状态时,都可以选择上下左右四个方向走一步,或者原地不动, 上下左右这四个动作的每一个都会将 agent 带到网格的一个新的单元格,即新的状态, 在迷宫中有一个网格处有宝箱,这个网格就是目标状态, 此外,在某些网格处还有一些炸弹, 我们的目标是找到一条没有炸弹的路径,以最快的速度从起始状态到达目标状态。
杨熹
2018-10-09
2.1K0
Bagging 简述
本文结构: 基本流程 有放回抽样的好处 Bagging 特点 sklearn 中 Bagging 使用 Bagging 和 Boosting 的区别 ---- bagging:bootstrap aggregating 的缩写。 是一种并行式集成学习方法,可用于二分类,多分类,回归等任务。 基本流程: 对一个包含 m 个样本的数据集,有放回地进行 m 次随机采样,这样得到具有 m 个样本的采样集。 取 T 个这样的采样集。 每个采样集训练一个基学习器。 结合:分类任务,使用简单投票法。回归任务,使用简单平
杨熹
2018-04-03
7620
用线性判别分析 LDA 降维
本文结构: 什么是 LDA 和 PCA 区别 LDA 投影的计算过程 LDA 降维的例子 ---- 1. 什么是 LDA 先说判别分析,Discriminant Analysis 就是根据研究对象的各种特征值,判别其类型归属问题的一种多变量统计分析方法。 根据判别标准不同,可以分为距离判别、Fisher 判别、Bayes 判别法等。例如,在 KNN 中用的是距离判别,朴素贝叶斯分类用的是 Bayes 判别,线性判别分析用的是 Fisher 判别式。 根据判别函数的形式,可以分为线性判别和非线性判别。 线性判
杨熹
2018-04-03
1.3K0
常用激活函数比较
本文结构: 什么是激活函数 为什么要用 都有什么 sigmoid ,ReLU, softmax 的比较 如何选择 ---- 1. 什么是激活函数 如下图,在神经元中,输入的 inputs 通过加权,求
杨熹
2018-04-03
1.6K0
【LEETCODE】模拟面试-84-Largest Rectangle in Histogram
题目: https://leetcode.com/problems/largest-rectangle-in-histogram/ Given n non-negative integers rep
杨熹
2018-04-03
6630
就因为没时间,才什么都能办到
《就因为没时间,才什么都能办到》 作者简介:吉田穗波,日本妇产科医生,五个孩子的妈。2008年,作为2个孩子的妈,准备留学;2009年,作为3个孩子的妈,考进哈佛;2011年,作为4个孩子的妈,完成学业;2014年,作为5个孩子的妈,该书出版。 越没有时间,越会大量涌现的“想要做那件事”的强烈欲望。 2004年,那时的吉田穗波只是一位妇产科医生,朝九晚五的工作,每天要花费三个小时在家、托儿所和医院间奔波,时间不够用,孩子和事业无法兼顾。 有了宝宝之后,很多妈妈都会选择为了孩子暂且放弃工作。然而在生活最忙碌的
杨熹
2018-04-02
8050
TensorFlow-1: 如何识别数字
本文通过使用 TensorFlow 搭建一个简单的神经网络来对 MNIST 数据集进行分类。通过训练模型,作者能够正确分类手写数字,并计算出准确率。
杨熹
2017-07-25
1.7K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档