数据山谷

23 篇文章
13 人订阅

全部文章

数据山谷

MIT大神写给女神的Q版Python画图库—Cutecharts【技术创作101训练营】

还记得那是一个月黑风高的晚上,一位女同事让我给他讲解数据分析结果的时候,我默默的用python画了下面这张图。

18660
数据山谷

Python|一文详解数据预处理

通常获取数据通常都是不完整的,缺失值、零值、异常值等情况的出现导致数据的质量大打折扣,而数据预处理技术就是为了让数据具有更高的可用性而产生的,在本文中让我们学习...

8640
数据山谷

深度学习|Tensorflow2.0进阶

合并是指将多个张量在某个维度上合并为一个张量,比如我们要将某学校所有的考试成绩单进行合并,张量A中记录了该学校1-4班的50名学生的9门科目的成绩,此时对应的s...

7520
数据山谷

机器学习|用Q-Learning走迷宫

上文中我们了解了Q-Learning算法的思想,基于这种思想我们可以实现很多有趣的功能和小demo,本文让我们通过Q-Learning算法来实现用计算机来走迷宫...

9630
数据山谷

机器学习|Q-Learning(强化学习)

我们在之前接触过了监督学习和无监督学习,强化学习可以看作是不同于二者的另一类算法,强化学习让计算机从什么都不懂的时刻开始,通过不断地尝试,从错误中学习,找到一种...

8810
数据山谷

Python|Pandas的常用操作

Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。

8140
数据山谷

机器学习|聚类(上)

对于训练样本的标记信息是未知的情况下,我们的目标就会变成通过对无标记训练样本的学习来揭示数据的内在性质及规律,我们把这样的学习方法称之为“无监督学习”,而在此类...

7730
数据山谷

Python|Numpy的常用操作

Python中常用的基本数据结构有很多,通常我们在进行简单的数值存储的时候都会使用list来进行,但是list的缺点在于对于每一个元素都需要有指针和对象,对于数...

6620
数据山谷

Python|让代码替你“说话”

程序员,在其他人眼中往往都是高冷的存在,在他们的眼中能用代码解决的问题绝对不考虑其他的方法,本文让我们用Python来提升一下高冷的档次,让我们用代码来“说话”...

14940
数据山谷

机器学习|AdaBoost

对于分类问题而言,给定一个训练样本集,求比较粗糙的分类规则(弱分类器)要比求精确的分类规则(强分类器)容易的多,提升方法就是从弱学习算法出发,反复学习,得到一系...

4510
数据山谷

机器学习|集成学习(简介)

接下来几周的时间,我们将会推出关于《西瓜书》读书笔记的连载文章,updating~

10230
数据山谷

深度学习|Tensorflow2.0基础

Tensorflow 是一个面向深度学习算法的科学计算库,内部数据保存在张量(Tensor)对象熵,所有的运算操作(Operation)也都是基于张量对象进行的...

6320
数据山谷

机器学习|常见的损失函数

在学习过程中我们经常会接触到损失函数、代价函数、目标函数三个词语,本文让我们来总结一下机器学习中常见的损失函数和代价函数。

5610
数据山谷

实战|用决策树实现NBA获胜预测

因为疫情原因导致NBA2019-2020赛季没有进行完,所以我们使用NBA2018-2019赛季的数据进行预测,数据获取方式有下面两种:

10820
数据山谷

Python|一行代码获取股票数据

随着金融行业的发展,金融相关的数据变得越来越有价值。股票的历史数据就是一种非常重要的时间序列数据,本文介绍一个不需要自己动手写爬虫就能够获取各个公司的股票信息的...

10320
数据山谷

特征选择

过滤式是过滤式的方法先对数据集进行特征选择,然后再训练学习器,特征选择过程与后续学习器无关,也就是说我们先用特征选择过程对初始特征进行“过滤”,再用过滤后的特征...

8130
数据山谷

机器学习|主成分分析(PCA)

在我们机器学习所训练的数据中,通常会存在着很多的特征,这也就意味着我们所要处理的数据的维度是很大的,由于维度大的数据处理起来非常困难,各种各样的降维算法也就随之...

8930
数据山谷

机器学习|KNN

之前一段时间我们了解到的算法中,可以说是一个比一个复杂,本文呢,我们不再增加难度,来说一个最基础、最简单的监督学习算法KNN。

8340
数据山谷

机器学习|LightGBM

上文中我们了解了一下XGBoost的原理,本文再来了解一下GBDT的另一个进化算法LightGBM,从原理上来说它和GBDT及XGBoost类似,都采用损失函数...

6820
数据山谷

机器学习|XGBoost

接下来几周的时间,我们将会推出关于《西瓜书》读书笔记的连载文章,updating~

10430

扫码关注云+社区

领取腾讯云代金券