首页
学习
活动
专区
工具
TVP
发布

Coggle数据科学

Coggle全称Communicatio For Kaggle,专注数据科学领域竞赛相关资讯分享。 微信公众号:Coggle数据科学
专栏作者
81
文章
101616
阅读量
31
订阅数
深入理解推荐系统:CTR平滑问题
在广告系统中,一个重要的指标是CTR。ctr=点击(Click)/曝光(Impression)。
Coggle数据科学
2022-08-31
8380
小米广告算法(CTR组)招聘
来自小米商业算法部广告算法(CTR组)的广告推荐职位,感兴趣的小伙伴,欢迎将简历投递至:wanghe11@xiaomi.com
Coggle数据科学
2021-07-06
5370
数据竞赛之常见数据抽样方式
该抽样方法是按等概率原则直接从总中抽取n个样本,这种随机样本方法简单,易于操作;但是它并不能保证样本能完美的代表总体,这种抽样的基本前提是所有样本个体都是等概率分布,但真实情况却是很多数样本都不是或无法判断是否等概率分布。在简单随机抽样中,得到的结果是不重复的样本集,还可以使用有放回的简单随机抽样,这样得到的样本集中会存在重复数据。该方法适用于个体分布均匀的场景。
Coggle数据科学
2020-12-15
1.2K0
深入理解推荐系统:特征交叉组合模型演化简史
深入理解推荐系统:Fairness、Bias和Debias​mp.weixin.qq.com
Coggle数据科学
2020-11-03
2.3K0
TIANCHI天池-OGeek算法挑战赛分享及完整代码(亚军)
首先很幸运拿到本次大赛的亚军,同时非常感谢大佬队友的带飞,同时希望我的分享与总结能给大家带来些许帮助,并且一起交流学习。
Coggle数据科学
2019-09-12
1.1K0
模型选择之交叉验证
交叉验证是在机器学习建立模型和验证模型参数时常用的办法,一般被用于评估一个机器学习模型的表现。更多的情况下,我们也用交叉验证来进行模型选择(model selection)。
Coggle数据科学
2019-09-12
1.5K0
集成学习概述
集成学习本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。也就是我们常说的“博采众长”。集成学习可以用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等,可以说所有的机器学习领域都可以看到集成学习的身影。本文就对集成学习方法进行简单的总结和概述。
Coggle数据科学
2019-09-12
5830
李航《统计学习方法》朴素贝叶斯分类器实现
朴素贝叶斯认为所有特征都是独立的,然后得出一个样本出现的概率使其所有特征出现概率的联乘。
Coggle数据科学
2019-09-12
6760
特征选择
特征选择是特征工程里的一个重要问题,其目标是寻找最优特征子集。特征选择能剔除不相关(irrelevant)或冗余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化模型,协助理解数据产生的过程。并且常能听到“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”,由此可见其重要性。但是它几乎很少出现于机器学习书本里面的某一章。然而在机器学习方面的成功很大程度上在于如果使用特征工程。
Coggle数据科学
2019-09-12
9700
JDD2018-人口动态普查与预测baseline0.1417
此baseline能达到0.1417的分数,分数一般,可以帮助快速进入到比赛。使用的时lightGBM模型,特征使用了年,月,日三个特征。在此基础上继续加特征分数还能提升。另外训练策略将所有distrcit分开训练,当然还可以使用其它策略。
Coggle数据科学
2019-09-12
4320
判别模型与生成模型
监督学习方法可以分为生成方法(generative approach)和判别方法(discriminative approach),所学到的模型分别称为生成模型(generative model)和判别模型(discriminative model)。
Coggle数据科学
2019-08-29
9370
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档