首页
学习
活动
专区
工具
TVP
发布

Coggle数据科学

Coggle全称Communicatio For Kaggle,专注数据科学领域竞赛相关资讯分享。 微信公众号:Coggle数据科学
专栏作者
81
文章
102534
阅读量
31
订阅数
深入理解推荐系统:阿里DIN原理与实践
文章首先介绍了现有的点击率 (CTR) 预估模型大都满足相同的模式: 先将大量的稀疏类别特征 (Categorical Features) 通过 Embedding 技术映射到低维空间, 再将这些特征的低维表达按照特征的类别进行组合与变换 (文中采用 in a group-wise manner 来描述), 以形成固定长度的向量 (比如常用的 sum pooling / mean pooling), 最后将这些向量 concatenate 起来输入到一个 MLP (Multi-Layer Perceptron) 中, 从而学习这些特征间的非线性关系.
Coggle数据科学
2022-08-31
5850
深入理解XGBoost:分布式实现
本文将重点介绍XGBoost基于Spark平台Scala版本的实现,带领大家逐步完成特征提取、变换和选择、XGBoost模型训练、Pipelines、模型选择。
Coggle数据科学
2020-03-17
3.8K0
李航《统计学习方法》K近邻学习算法实现
Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。
Coggle数据科学
2019-09-12
4230
李航《统计学习方法》感知机学习算法实现
感知机学习算法的初始形式 Python代码 import numpy as np def Train(X_train, Y_train): #获取维度参数 m, n = np.sha
Coggle数据科学
2019-09-12
4680
李航《统计学习方法》逻辑斯蒂回归
Logistic regression算法 Python代码 import numpy as np def loadData(filename): dataset = []; labels
Coggle数据科学
2019-09-12
4180
机器学习/数据挖掘面试总结
一面基本从项目里面提问,所有所写项目务必全部吃透,例如为何用这个模型,和其它的模型的区别,为什么不选用其它模型。
Coggle数据科学
2019-09-12
8450
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档