首页
学习
活动
专区
工具
TVP
发布

杨熹的专栏

专栏成员
302
文章
379189
阅读量
55
订阅数
为什么在优化算法中使用指数加权平均
指数加权平均(exponentially weighted averges),也叫指数加权移动平均,是一种常用的序列数据处理方式。
杨熹
2018-08-10
1.9K0
几种简单的文本数据预处理方法
本文将介绍几种简单的文本数据预处理方法,希望与大家共同学习分享。
杨熹
2018-04-03
9280
什么是 ROC AUC
本文结构: 什么是 ROC? 怎么解读 ROC 曲线? 如何画 ROC 曲线? 代码? 什么是 AUC? 代码? ---- ROC 曲线和 AUC 常被用来评价一个二值分类器的优劣。 先来看一下混淆矩
杨熹
2018-04-03
1.3K0
用 Pipeline 将训练集参数重复应用到测试集
当我们对训练集应用各种预处理操作时(特征标准化、主成分分析等等), 我们都需要对测试集重复利用这些参数。 pipeline 实现了对全部步骤的流式化封装和管理,可以很方便地使参数集在新数据集上被重复使用。 pipeline 可以用于下面几处: 模块化 Feature Transform,只需写很少的代码就能将新的 Feature 更新到训练集中。 自动化 Grid Search,只要预先设定好使用的 Model 和参数的候选,就能自动搜索并记录最佳的 Model。 自动化 Ensemble Generat
杨熹
2018-04-03
1K0
用学习曲线 learning curve 来判别过拟合问题
本文结构: 学习曲线是什么? 怎么解读? 怎么画? ---- 学习曲线是什么? 学习曲线就是通过画出不同训练集大小时训练集和交叉验证的准确率,可以看到模型在新数据上的表现,进而来判断模型是否方差偏高或
杨熹
2018-04-03
2.5K0
Machine Learning Notes-Linear Regression-Udacity
Regression 就是想找到因变量和自变量之间的关系,用一个函数来表示,并且可用这个函数来预测任意一个新的 x 会有怎样的 y 。 那么怎么找最好的那条线来表示 x 与 y 之间的关系呢? 用积分
杨熹
2018-04-02
6390
Machine Learning Notes-Decision Trees-Udacity
什么是 Decision Tree? Decision Tree 可以把 Input 映射到离散的 Labels。对每个节点上的 Attribute 提问,取不同的 Value 走向不同的 Chi
杨熹
2018-04-02
7260
支持向量机
Udacity Machine Learning Support Vector Machine 在做分类问题时,想要找到最好的那条线: 会选择中间的那条线,为什么没有选择平行的另外两条线,因为它们
杨熹
2018-04-02
8380
The Chinese zodiac
haoLan: The Chinese zodiac, explained Asking a zodiac sign is a polite way of asking your age. By revealing your zodiac sign, you are also being evaluated. Judgments are being made about your fortune or misfortune, your personality, career prospects and
杨熹
2018-04-02
8450
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档