Coggle数据科学

Coggle全称Communicatio For Kaggle,专注数据科学领域竞赛相关资讯分享。 微信公众号:Coggle数据科学
64 篇文章
23.8K 次阅读
29 人订阅

全部文章

Coggle数据科学

机器学习中“距离与相似度”计算汇总

涵盖了常用到的距离与相似度计算方式,其中包括欧几里得距离、标准化欧几里得距离、曼哈顿距离、汉明距离、切比雪夫距离、马氏距离、兰氏距离、闵科夫斯基距离、编辑距离、...

8610
Coggle数据科学

深入理解推荐系统:超长用户行为序列建模

作为【推荐系统】系列文章的第七篇,将以CIKM2020中的一篇论文“Search-based User Interest Modeling with Lifel...

13320
Coggle数据科学

数据竞赛之常见数据抽样方式

该抽样方法是按等概率原则直接从总中抽取n个样本,这种随机样本方法简单,易于操作;但是它并不能保证样本能完美的代表总体,这种抽样的基本前提是所有样本个体都是等概率...

6920
Coggle数据科学

深入理解推荐系统:推荐系统中的attention机制

深入理解推荐系统:Fairness、Bias和Debias​mp.weixin.qq.com

12320
Coggle数据科学

深入理解推荐系统:特征交叉组合模型演化简史

深入理解推荐系统:Fairness、Bias和Debias​mp.weixin.qq.com

17410
Coggle数据科学

2020腾讯广告算法大赛方案分享(亚军)

本届算法大赛的题目来源于一个重要且有趣的问题。众所周知,像用户年龄和性别这样的人口统计学特征是各类推荐系统的重要输入特征,其中自然也包括了广告平台。这背后的假设...

11940
Coggle数据科学

深入理解推荐系统:Fairness、Bias和Debias

作为【推荐系统】系列文章的第四篇,将以推荐系统的“Fairness公平性”作为今天的主角,会从四个方面来介绍Fairness的相关问题、解决方案、相关比赛和参考...

13820
Coggle数据科学

厦门国际银行 “数创金融杯”数据建模大赛-冠军分享

成员介绍:团队成员由当下国内赛圈著名选手组成,一月三冠选手宁缺,赛圈网红林有夕,以及最具潜力选手孙中宇组成。

25430
Coggle数据科学

2020腾讯广告算法大赛:赛题理解与解题思路

期待已久的2020腾讯广告算法大赛终于开始了,本届赛题“广告受众基础属性预估”。本文将给出解题思路,以及最完备的竞赛资料,助力各位取得优异成绩!!!报名链接:

23710
Coggle数据科学

深入理解推荐系统:排序

最近正好在做KDD Cup:Debiasing赛道,不同于其它类型的比赛,推荐系统中的排序建模需要大家自己构建正负样本。本文也将作为方法梳理,希望能帮助到大家。

29611
Coggle数据科学

2020 KDD Cup:Debiasing phase4 baseline 0.25

"该赛道的数据集强调电商推荐系统的公平性,尤其是流量较少的广大中小商家所面临的“有好货缺无人问津”的困境。数据横跨十余天,中间还穿插了某次全网促销活动,涵盖了一...

24910
Coggle数据科学

冠军7w美金,2020腾讯广告算法大赛正式开始!!!

期待已久的2020腾讯广告算法大赛终于开始了,本届赛题“广告受众基础属性预估”。本文将给出基本解题思路,以及最完备的竞赛资料,助力各位取得优异成绩!!!

35820
Coggle数据科学

KDD Cup 2020 推荐系统赛道—数据分析

近期对推荐系统颇为感兴趣,正巧看到今年KDD Cup赛题中有两道都是推荐相关的,借着这次机会学习学习。本文将对KDD Cup 2020 Challenges f...

50610
Coggle数据科学

深入理解推荐系统:召回

鱼遇雨欲语与余:深入理解YouTube推荐系统算法​zhuanlan.zhihu.com

83322
Coggle数据科学

深入理解XGBoost:分布式实现

本文将重点介绍XGBoost基于Spark平台Scala版本的实现,带领大家逐步完成特征提取、变换和选择、XGBoost模型训练、Pipelines、模型选择。

53930
Coggle数据科学

基于GNN的图表示学习及其应用

本文内容分两部分,第一部分为基于 GNN 的图表示学习,共包含两节,第1节主要从三种建模方法上对图表示学习进行对比阐述;第2节分别从两类无监督学习目...

27810
Coggle数据科学

抗击肺炎:新冠肺炎疫情数据可视化及疫情预测分析

在新型冠状病毒感染的肺炎疫情牵动社会人心的关键时刻,本文将利用数据分析、数据挖掘、机器学习相关方法,围绕疫情态势展示、疫情走势预测进行分析,挖掘复杂异构多源数据...

1K30
Coggle数据科学

2019腾讯广告算法大赛方案分享(初赛冠军)

bettenW/Tencent2019_Finals_Rank1st​github.com

88121
Coggle数据科学

GNN 系列(二):图神经网络的“开山之作”GCN模型

这是我们介绍图神经网络的第一篇文章,取自Kipf et al. 2017,文章中提出的模型叫Graph Convolutional Network(GCN),个...

94510
Coggle数据科学

GNN 系列(三):GraphSAGE

在GCN的博文中我们重点讨论了图神经网络的逐层传播公式是如何推导的,然而,GCN的训练方式需要将邻接矩阵和特征矩阵一起放到内存或者显存里,在大规模图数据上是不可...

22920

扫码关注云+社区

领取腾讯云代金券