首页
学习
活动
专区
工具
TVP
发布

Datawhale专栏

专栏作者
491
文章
696446
阅读量
75
订阅数
我写了一份初学者的学习实践教程!
上周在Datawhale分享了一篇关于数据挖掘赛事的baseline方案,有老师把它作为学习资料给学生实践学习后,有挺多同学反应学习实践中仍然有困难:
Datawhale
2022-10-31
2840
天池算法大赛项目:基于大规模日志的故障诊断亚军方案!
第三届阿里云磐久智维算法大赛:本次比赛要求选手基于故障工单与系统日志数据构建多分类模型,要求能够快速高效的定位出故障类型。
Datawhale
2022-10-31
8880
时间序列预测一定需要深度学习模型吗?
时间序列预测是机器学习中的一项常见的任务,具有非常广泛的应用,例如:电力能源、交通流量和空气质量等预测。传统的时间序列预测模型往往依赖于滚动平均、向量自回归和自回归综合移动平均。另一方面,最近有人提出了深度学习和矩阵分解模型来解决时间序列预测问题,并获得了更具竞争力的性能,但是该类模型往往过于复杂。
Datawhale
2022-05-29
5000
特征工程在实际业务中的应用!
知乎|https://www.zhihu.com/people/xu-xiu-jian-33
Datawhale
2022-02-17
4460
深度学习的三个主要步骤!
神经网络类似于人类的神经细胞,电信号在神经元上传递,类似于数值在神经网络中传递的过程。
Datawhale
2021-08-27
1.8K0
鱼佬:百行代码入手数据挖掘赛!
本实践以科大讯飞xDatawhale联合举办的数据挖掘赛为例,给出了百行代码Baseline,帮助学习者更好地结合赛事实践。同时,在如何提分上进行了详细解读,以便于大家进阶学习。
Datawhale
2021-07-12
4120
从0梳理1场数据挖掘赛事!
摘要:数据竞赛对于大家理论实践和增加履历帮助比较大,但许多读者反馈不知道如何入门,本文以河北高校数据挖掘邀请赛为背景,完整梳理了从环境准备、数据读取、数据分析、特征工程和数据建模的整个过程。
Datawhale
2021-02-05
6840
机器学习中的特征工程总结!
传统编程的关注点是代码。在机器学习项目中,关注点变成了特征表示。也就是说,开发者通过添加和改善特征来调整模型。“Garbage in, garbage out”。对于一个机器学习问题,数据和特征往往决定了结果的上限,而模型、算法的选择及优化则是在逐步接近这个上限。特征工程,顾名思义,是指从原始数据创建特征的过程。
Datawhale
2020-10-27
2K0
万字长文带你了解推荐系统全貌!
如果说互联网的目标就是连接一切,那么推荐系统的作用就是建立更加有效率的连接,推荐系统可以更有效率的连接用户与内容和服务,节约了大量的时间和成本。
Datawhale
2020-10-27
6430
机器学习训练中常见的问题和挑战!
由于我们的主要任务是选择一种学习算法,并对某些数据进行训练,所以最可能出现的两个问题不外乎是“坏算法”和“坏数据”,本文主要从坏数据出发,带大家了解目前机器学习面临的常见问题和挑战,从而更好地学习机器学习理论。
Datawhale
2020-10-23
2820
新人赛《金融风控贷款违约》避坑指南!
本文以天池的金融风控赛为背景,梳理了金融风控的整个实践流程,帮助大家避坑学习。赛事的场景是个人信贷,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这个问题在现实的风控场景中很常见,属于典型的分类问题。另外,准入模型,评分卡模型皆是属于这个范畴。
Datawhale
2020-10-23
2.6K0
机器学习在金融风控的经验总结!
由于金融风控场景的特殊性,很多算法同学在刚进入这个领域容易“水土不服”,为了使机器学习项目(也包括图算法相关的应用)落地更加顺利,本文介绍下实践过程的一些经验和踩过的坑。
Datawhale
2020-09-22
2.4K0
一文详尽之支持向量机算法!
寄语:本文介绍了SVM的理论,细致说明了“间隔”和“超平面”两个概念;随后,阐述了如何最大化间隔并区分了软硬间隔SVM;同时,介绍了SVC问题的应用。最后,用SVM乳腺癌诊断经典数据集,对SVM进行了深入的理解。
Datawhale
2020-05-16
7880
数据挖掘入门指南!!!
摘要:入门数据挖掘,必须理论结合实践。本文梳理了数据挖掘知识体系,帮助大家了解和提升在实际场景中的数据分析、特征工程、建模调参和模型融合等技能。
Datawhale
2020-04-21
7970
双节棍「大师」鱼佬亲传武功秘籍:如何进行一场数据挖掘算法竞赛?
简介:鱼遇雨欲语与余,Datawhale成员,武汉大学硕士,天池数据科学家。2019腾讯广告算法大赛冠军,数据竞赛爱好者。
Datawhale
2020-04-16
4110
「特征工程」之零基础入门数据挖掘
摘要:对于数据挖掘项目,本文将学习应该从哪些角度做特征工程?从哪些角度做数据清洗,如何对特征进行增删,如何使用PCA降维技术等。
Datawhale
2020-04-15
9800
数据挖掘竞赛指南:曾经的数据挖掘少年,如今的阿里算法大佬
简介:杰少,南京大学硕士,天池数据科学家,就职于阿里。KDD19, NIPS18, JDD19第二名,天池竞赛5次Top3,其他数据竞赛平台奖项20余项。
Datawhale
2020-04-15
4820
天池-安泰杯跨境电商智能算法大赛(冠军)方案分享
在19年9月下旬结束的"安泰杯"跨境电商智能算法大赛中,来自京东零售的法国南部队伍成功从1960支队伍中脱颖而出,在复赛阶段成功逆袭到第一,并通过答辩获得冠军。在接近2千只参赛队伍中他们如何取胜,并成功压制住植物的反击,他们获胜方案又有什么可取之处?本文将会给出完整的赛题解析和解题方案介绍。
Datawhale
2019-12-22
1.2K0
一文盘点AutoML 库,自动机器学习演讲摘要
Jeff Dean在ICML 2019上进行了有关AutoML的演讲,并将自动化分为4个级别:
Datawhale
2019-12-09
9100
深度学习在推荐系统中的应用
2016年DeepMind开发的AlphaGo在围棋对决中战胜了韩国九段选手李世石,一时成为轰动全球的重大新闻,被全球多家媒体大肆报道。AlphaGo之所以取得这么大的成功,这其中最重要的技术之一是深度学习技术。经过这几年的发展,深度学习技术已经在图像分类、语音识别、自然语言处理等领域取得突破性进展,甚至在某些方面(如图像分类等)超越了人类专家的水平。深度学习技术驱动了第三次人工智能浪潮的到来。
Datawhale
2019-10-23
4700
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档