首页
学习
活动
专区
工具
TVP
发布

Datawhale专栏

专栏作者
504
文章
699175
阅读量
75
订阅数
机器学习算法备忘单!
机器学习(ML)是人工智能(AI)和计算机科学的一个子领域,主要是利用数据和算法来模仿人的学习方式,逐步提高其准确性。使用这个树状图作为指南,以确定使用哪种ML算法来解决你的AI问题。
Datawhale
2022-10-31
3530
我的Pandas学习经历及动手实践
Pandas 可以说是基于 NumPy 构建的含有更高级数据结构和分析能力的工具包, 实现了类似Excel表的功能,可以对二维数据表进行很方便的操作。
Datawhale
2022-04-08
1.7K0
坚持刷题678天的感受!
刷题的原因各种各样,结合本人和朋友的经历,以及网上大家的分享,比较有代表性的原因有以下四种:
Datawhale
2021-06-01
8830
图神经网络的解释性综述!
图神经网络的可解释性是目前比较值得探索的方向,今天解读的2021最新综述,其针对近期提出的 GNN 解释技术进行了系统的总结和分析,归纳对比了该问题的解决思路。作者还为GNN解释性问题提供了标准的图数据集和评估指标,将是这一方向非常值得参考的一篇文章。
Datawhale
2021-05-07
1.1K0
SQL重要知识点梳理!
有读者留言面试有点虚,数据库都忘的差不多了,与其临时抱佛脚,不如我们把MySQL的知识点梳理一遍,心中有知识点,面试不慌。
Datawhale
2021-04-20
7610
GNN框架之大规模分布式训练!
本文为GNN教程的DGL框架之大规模分布式训练,前面的文章中我们介绍了图神经网络框架DGL如何利用采样的技术缩小计算图的规模来通过mini-batch的方式训练模型,当图特别大的时候,非常多的batches需要被计算,因此运算时间又成了问题,一个容易想到解决方案是采用并行计算的技术,很多worker同时采样,计算并且更新梯度。这篇博文重点介绍DGL的并行计算框架。
Datawhale
2021-02-05
1.5K0
GNN教程:DGL框架中的采样模型!
本文为GNN教程的系列干货。之前介绍了DGL这个框架,以及如何使用DGL编写一个GCN模型,用在学术数据集上,这样的模型是workable的。然而,现实生活中我们还会遇到非常庞大的图数据,庞大到邻接矩阵和特征矩阵不能同时塞进内存中,这时如何解决这样的问题呢?
Datawhale
2021-01-20
1.7K0
数据清洗指南完整分享
01-启动阶段 import os import pandas as pd import numpy as np # 显示当前工作路径 os.getcwd() # 罗列当前路径下的所有文件 os.listdir() # 改变工作目录 os.chdir("/PATH/TO/SAMSHARE") # 初始化基础目录 data_path = './02_data/' save_path = './03_model/' output_path = './04_output/' 02-导入数据 # 读取
Datawhale
2020-12-08
8460
GNN教程:GraghSAGE算法细节详解!
本文为GNN教程的第三篇文章 【GraghSAGE算法】,在GCN的博文中我们重点讨论了图神经网络的逐层传播公式是如何推导的,然而,GCN的训练方式需要将邻接矩阵和特征矩阵一起放到内存或者显存里,在大规模图数据上是不可取的。
Datawhale
2020-11-23
1.3K1
数据分析之Pandas缺失数据处理
3. 缺失数据的运算与分组 3.1. 加号与乘号规则 3.2. groupby方法中的缺失值 4. 填充与剔除 4.1. fillna方法 4.2. dropna方法 5. 插值
Datawhale
2020-07-06
1.6K0
程序的灵魂!数据结构完整知识框架及学习推荐
摘要:数据结构与算法是程序的灵魂,无论是在计算机领域深造,还是从事开发、算法、数据分析等工作,都是必备的核心基础知识。本文梳理了数据结构与算法的完整知识框架,同时对于初学者,给予了学习课程推荐。
Datawhale
2020-05-07
1K0
快乐学习Pandas入门篇:Pandas基础
寄语:本文对Pandas基础内容进行了梳理,从文件读取与写入、Series及DataFrame基本数据结构、常用基本函数及排序四个模块快速入门。同时,文末给出了问题及练习,以便更好地实践。
Datawhale
2020-04-22
2.4K0
一文轻松了解Graph Neural Networks
图结构数据在各个领域都很常见,例如{分子、社会、引用、道路}网络等,这些只是可以用图表示的大量数据中的一小部分。随着机器学习的进步,我们见证了在可用数据上应用智能算法的潜力。图神经网络是机器学习的一个分支,它以最有效的方式建立图数据的神经网络。
Datawhale
2020-03-04
4540
Pandas基础用法合集(中文官档)
head() 与 tail() 用于快速预览 Series 与 DataFrame,默认显示 5 条数据,也可以指定要显示的数量。
Datawhale
2019-11-27
4410
一文梳理面试中的数据结构与算法
据我了解,相当一部分同学不是科班出身,以至于对“数据结构”和“算法”的基础概念都不是很清晰,这直接导致很多人在看到有关这部分的内容就会望而却步。
Datawhale
2019-09-27
6570
Debug Your Life!关于学习、面试和工作成长(附B站录播)
--- Jack Kerouac <The Dharm Bums>
Datawhale
2019-08-23
6380
GNN 系列(三):GraphSAGE
Inductive learning v.s. Transductive learning
Datawhale
2019-08-13
1.4K0
GNN 系列:图神经网络的“开山之作”CGN模型
考虑图(例如引文网络)中节点(例如文档)的分类问题,通常该图中只有一小部分节点有标签。这类问题可以划分到基于图的半监督学习问题中。为了对节点进行分类,首先我们可以利用节点自身的特征信息,除此之外,我们还可以利用图结构信息,因此一个典型的图半监督学习问题可以采用下面的学习策略:
Datawhale
2019-08-06
1.1K0
GNN 系列:Graph 基础知识介绍
欧几里德空间(Euclidean Space),简称为欧氏空间(也可以称为平直空间),在数学中是对欧几里德所研究的2维和3维空间的一般化。这个一般化把欧几里德对于距离、以及相关的概念长度和角度,转换成任意数维的坐标系。如下图所示。
Datawhale
2019-08-02
3K0
深度学习在金融领域的应用
现在我们正处在一个深度学习时代,CV领域基本上已经被NN所统治,NLP、推荐也有不同程度的大规模应用。似乎很多从业者对风控领域的认知是我们一定不会使用深度学习方法,归根结底是因为它本身是一个黑箱模型,解释性较差。但是个人理解当我们从LR转向XGBoost的时候,解释性其实就已经不复存在了。纵观整个机器学习界,无外乎都是从传统机器学习逐渐过渡到NN的一个过程,个人觉得深度学习在各个领域的普及是迟早的事情。
Datawhale
2019-07-08
1.4K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档