首页
学习
活动
专区
工具
TVP
发布

程序员小王

专栏作者
104
文章
87430
阅读量
29
订阅数
如何将NumPy数组保存到文件中以进行机器学习
祝大家新年快乐,今天看到的文章然后就翻译了一下,涉及到的技术点都很简单,算是一篇水文,而且我对文章的改动比较大,但是还希望能给你带来一点帮助。
PM小王
2020-01-15
7.6K0
机器学习实战--对亚马逊森林卫星照片进行分类(2)
分类准确性通常适用于二进制分类任务,每个类中具有平衡数量的示例。在这种情况下,我们既不使用二进制或多类分类任务; 相反,它是一个多标签分类任务,标签数量不均衡,有些使用比其他标签更重要。因此,Kaggle比赛组织选择了F-beta指标,特别是F2得分。这是与F1分数(也称为F-measure)相关的度量。
PM小王
2019-07-02
7750
第 05 课:使用 XGBoost 进行功能重要性
使用诸如梯度提升之类的决策树方法的集合的好处是它们可以从训练的预测模型自动提供特征重要性的估计。 经过训练的 XGBoost 模型可自动计算预测建模问题的特征重要性。 这些重要性分数可在训练模型的 feature_importances_ 成员变量中找到。例如,它们可以直接打印如下:
PM小王
2019-07-02
1K0
第 06 课:如何配置梯度提升
梯度提升是应用机器学习最强大的技术之一,因此很快成为最受欢迎的技术之一。 但是,如何为您的问题配置梯度提升?
PM小王
2019-07-02
3950
第 04 课:监控表现和提前停止
XGBoost 模型可以在训练期间评估和报告模型的测试集上的表现。 它通过在训练模型和指定详细输出(verbose=True)时调用 **model.fit()**时指定测试数据集和评估指标来支持此功能。 例如,我们可以在训练XGBoost模型时报告独立测试集(eval_set )上的二进制分类错误率(错误),如下所示:
PM小王
2019-07-02
5000
第 02 课:XGBoost 简介
XGBoost 是为速度和表现而设计的梯度提升决策树的实现。 XGBoost 代表e X treme G radient Boosti ng。 它由陈天琪开发,激光专注于计算速度和模型表现,因此几乎没有多余的装饰。除了支持该技术的所有关键变体之外,真正感兴趣的是通过精心设计实施所提供的速度,包括:
PM小王
2019-07-02
4720
第 03 课:开发您的第一个 XGBoost 模型
假设您有一个可用的SciPy环境,可以使用pip轻松安装 XGBoost。 例如:
PM小王
2019-07-02
6060
在Python中开始使用 XGBoost的7步迷你课程
熟悉我的读者知道我不止一次的给大家推荐过ApacheCN这个开源组织,ApacheCN 是 2016 年 8 月份就开始搭建网站雏形, 2017 年 6 月份正式全职来做,是国内第一个有组织性、敢带人装X、敢真的分享、并且敢戴绿帽的中文开源组织,传送门:https://github.com/apachecn
PM小王
2019-07-02
6980
第 01 课:梯度提升简介
提升的想法来自于弱学习器是否可以被修改为变得更好的想法。应用程序取得巨大成功的第一个实现提升的是Adaptive Boosting或简称 AdaBoost。AdaBoost中的弱学习器是决策树,只有一个分裂,称为决策树桩的短缺。
PM小王
2019-07-02
3440
机器学习(一)导论
今天的文章是机器学习的导论,这会像Python基础教程和爬虫教程一样是一个连载系列,但是在机器学习领域自己还没入门,只是通过一次比赛接触到机器学习使用了几个模型罢了,这个系列单纯把自己学习笔记和学习体会分享给大家,更新可能会比较慢,期待大家一起进步。
PM小王
2019-07-02
4190
从0开始如何用一个月杀进机器学习比赛Top25%
已经有好几天没有更文了,有的读者可能知道自己正在打一场 机器学习 比赛:住房月租金预测大数据赛。今天,Ahab把这场比赛的一些收获和自己入坑机器学习之路的收获分享给大家。本文并不会讲解比赛的代码和相关知识的运用,当然后续会把代码实操和理论分析分享给大家。话不多说,我们开始吧!
PM小王
2019-07-02
4910
【剑指Offer】机器学习面试题(1)
好久没有整理面试题了,最近总有读者翻出之前的面试题,问我会不会继续整理,今天给大家分享一波自己整理的常见机器学习面试题。
PM小王
2019-07-02
5560
机器学习实战--住房月租金预测(3)
这是机器学习系列的第三篇文章,对于住房租金预测比赛的总结这将是最后一篇文章了,比赛持续一个月自己的总结竟然也用了一个月,牵强一点来说机器学习也将会是一个漫长的道路,后续机器学习的文章大多数以知识科普为主,毕竟自己在机器学习这个领域是个渣渣,自己学到的新知识点会分享给大家的。
PM小王
2019-07-02
1K0
机器学习实战--住房月租金预测(1)
上次分享的从0开始如何用一个月杀进机器学习比赛Top25%受到很多小伙伴的支持,今天继续分享这次比赛的收获。本文会讲解数据集的分析。话不多说,我们开始吧!
PM小王
2019-07-02
1.5K1
第 07 课:XGBoost 超参数调整
scikit-learn 框架提供了搜索参数组合的功能。 此功能在 GridSearchCV 类中提供,可用于发现配置模型以获得最佳表现的最佳方法。 例如,我们可以定义一个树的数量(n_estimators)和树大小(max_depth)的网格,通过将网格定义为:
PM小王
2019-07-01
1.9K0
机器学习实战--住房月租金预测(2)
公众号断更好几天了,期末了难免有点忙,在这跟大家说一声抱歉。上次对租金预测比赛进行的是数据分析部分的处理机器学习实战--住房月租金预测(1),今天继续分享这次比赛的收获。本文会讲解对特征工程的处理。话不多说,我们开始吧!
PM小王
2019-07-01
5330
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档