首页
学习
活动
专区
工具
TVP
发布

Datawhale专栏

专栏作者
504
文章
698761
阅读量
75
订阅数
4位GNN一线大佬新书出版了!
广大图神经网络(Graph Neural Network,下文简称GNN)研究人员翘首以盼、吴凌飞、崔鹏、裴健、赵亮4位GNN领域的中青年影响力学者联合编写《图神经网络:基础、前沿与应用》终于要来啦!
Datawhale
2023-01-07
3020
《如何打一场数据挖掘赛事》进阶版
经过上一篇的入门学习,大家已经熟悉如何去打一场比赛,并能训练经典的机器学习算法模型,去解决实际的问题。如果你还不了解,可以先学习《如何打一个数据挖掘比赛》 入门版,然后再进行本节的学习。
Datawhale
2022-10-31
3230
《如何打一场数据挖掘赛事》入门版
这是一份简易的竞赛教程,我们的目的是帮助同学们迈出 AI 训练大师之路的第一步。数据挖掘中会有很多需要学习的地方,建议入门的同学可以暂时不用着急去弄懂各个代码的原理,先跑通代码,然后看代码中的涉及的知识点去查询相关资料进行学习,这样能让你学习更加有目标性,也容易找到学习的乐趣。千里之行,始于足下,从这里,开启你的 AI 学习之旅吧!
Datawhale
2022-10-31
2260
北航学长的NLP赛事教程!
在人工智能领域的学习中,研读有关文献是非常重要的学习途径,而如何在汗牛充栋的论文库中,高效快速的检索到相关重要文献,就成为知识学习首先要解决的难点。
Datawhale
2022-10-31
4190
我写了一份初学者的学习实践教程!
上周在Datawhale分享了一篇关于数据挖掘赛事的baseline方案,有老师把它作为学习资料给学生实践学习后,有挺多同学反应学习实践中仍然有困难:
Datawhale
2022-10-31
2840
天池算法大赛项目:基于大规模日志的故障诊断亚军方案!
第三届阿里云磐久智维算法大赛:本次比赛要求选手基于故障工单与系统日志数据构建多分类模型,要求能够快速高效的定位出故障类型。
Datawhale
2022-10-31
8900
郑冠杰:KDD Cup城市大脑赛题方法总结!
视频地址:https://www.bilibili.com/video/BV1ny4y147wm/
Datawhale
2021-05-07
8030
鱼佬:我的数据挖掘之路!
视频地址:https://www.bilibili.com/video/BV1S54y187XM
Datawhale
2021-04-20
4860
基于LightGBM算法实现数据挖掘!
本赛题是一个多分类的数据挖掘问题。赛题以医疗数据挖掘为背景,要求选手使用提供的心跳信号传感器数据训练模型并完成不同心跳信号的分类的任务。
Datawhale
2021-04-20
7130
从0梳理1场数据挖掘赛事!
摘要:数据竞赛对于大家理论实践和增加履历帮助比较大,但许多读者反馈不知道如何入门,本文以河北高校数据挖掘邀请赛为背景,完整梳理了从环境准备、数据读取、数据分析、特征工程和数据建模的整个过程。
Datawhale
2021-02-05
6840
北航学长:DCIC 2021的算法方案讲解
DCIC 作为每年具有重要影响力的政府赛事,除了高认可,高奖金,最重要的是开放了政府和企业的真实数据,具有研究和落地价值,但对于刚参加赛事的同学,还是有难度的,希望通过分享让更初学者也能参与学习实践和研究。
Datawhale
2021-02-05
5410
一份完整的数据科学竞赛指南!
‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍“听过很多道理,却依然过不好一生;看过很多分享,却依然做不好比赛。”
Datawhale
2020-12-08
1.4K0
基于机器学习的文本分类!
据不完全统计,网民们平均每人每周收到的垃圾邮件高达10封左右。垃圾邮件浪费网络资源的同时,还消耗了我们大量的时间。大家对此深恶痛绝,于是识别垃圾邮件并对其进行过滤成为各邮件服务商的重要工作之一。
Datawhale
2020-08-10
2.5K0
数据挖掘入门指南!!!
摘要:入门数据挖掘,必须理论结合实践。本文梳理了数据挖掘知识体系,帮助大家了解和提升在实际场景中的数据分析、特征工程、建模调参和模型融合等技能。
Datawhale
2020-04-21
7970
双节棍「大师」鱼佬亲传武功秘籍:如何进行一场数据挖掘算法竞赛?
简介:鱼遇雨欲语与余,Datawhale成员,武汉大学硕士,天池数据科学家。2019腾讯广告算法大赛冠军,数据竞赛爱好者。
Datawhale
2020-04-16
4110
「特征工程」之零基础入门数据挖掘
摘要:对于数据挖掘项目,本文将学习应该从哪些角度做特征工程?从哪些角度做数据清洗,如何对特征进行增删,如何使用PCA降维技术等。
Datawhale
2020-04-15
9810
「数据分析」之零基础入门数据挖掘
摘要:对于数据挖掘项目,本文将学习应该从哪些角度分析数据?如何对数据进行整体把握,如何处理异常值与缺失值,从哪些维度进行特征及预测值分析?
Datawhale
2020-04-07
8880
【时空序列预测】什么是时空序列问题?这类问题主要应用了哪些模型?
有幸接触这个有趣的领域,也在最近和很多这个领域的大牛有了一些浅度的交流,真切的感觉到这个领域的缺乏和重要性,这个领域在我看来,商业价值大,有前途,但难度大,不过有趣。
Datawhale
2019-11-28
1.7K0
整理一份详细的数据预处理方法
熟悉数据挖掘和机器学习的小伙伴们都知道,数据处理相关的工作时间占据了整个项目的70%以上。数据的质量,直接决定了模型的预测和泛化能力的好坏。它涉及很多因素,包括:准确性、完整性、一致性、时效性、可信性和解释性。而在真实数据中,我们拿到的数据可能包含了大量的缺失值,可能包含大量的噪音,也可能因为人工录入错误导致有异常点存在,非常不利于算法模型的训练。数据清洗的结果是对各种脏数据进行对应方式的处理,得到标准的、干净的、连续的数据,提供给数据统计、数据挖掘等使用。
Datawhale
2019-10-30
8010
数据竞赛Tricks集锦
本文将对数据竞赛的『技巧』进行全面的总结,同时还会分享下个人对比赛方法论的思考。前者比较客观,总结了不同数据类型下涉及到的比赛技巧;后者稍微主观,是我个人对解决比赛思路的总结。
Datawhale
2019-09-19
4980
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档