首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

猿创征文|数据导入与预处理-第3章-pandas基础

1.5.3.1 使用单层索引访问数据 1.5.3.2 使用分层索引访问数据 1.6 统计计算与统计描述 1.6.1 常见的统计计算函数 1.6.2 统计描述 1.7 绘制图形 1 Pandas概述 1.1...pandas是一个快速、强大、灵活且易于使用的开源数据分析和操作工具,构建在Python编程语言之上。...关于pandas,官方的解释是,pandas是一个基于BSD开源协议的开源库,提供了用于python编程语言的高性能、易于使用的数据结构和数据分析工具。 这里还提到了BSD开源协议。...1.3.2创建Series对象: 基于列表创建: In [1]: import pandas as pd In [2]: ser_obj = pd.Series(['Python', 'Java', '...1.5.3.2 使用分层索引访问数据 掌握分层索引的使用方式,可以通过[]、loc和iloc访问Series类对象和DataFrame类对象的数据 pandas中除了可以通过简单的单层索引访问数据外,

13.9K20

数据科学 IPython 笔记本 7.8 分层索引

7.8 分层索引 原文:Hierarchical Indexing 译者:飞龙 协议:CC BY-NC-SA 4.0 本节是《Python 数据科学手册》(Python Data Science...使用我们已经介绍过的 Pandas 工具,你可能只想使用 Python 元组作为键: index = [('California', 2000), ('California', 2010),...作为额外维度的MultiIndex 你可能会注意到其他内容:我们可以使用带有索引和标签的简单DataFrame,来轻松存储相同的数据。事实上,Pandas 的构建具有这种等价关系。...Python 的内置slice()函数,显式构建所需的切片,来解决这个问题,但在这种情况下,更好的方法是使用IndexSlice对象,正是由 Pandas 为这种情况提供的。...2010 19378102 Texas 2000 20851820 2010 25145561 dtype: int64 ''' 索引设置和重设 重排分层数据的另一种方法是将索引标签转换为

4.2K20
您找到你想要的搜索结果了吗?
是的
没有找到

python置矩阵代码_python 矩阵

python怎么实现矩阵的置 只能用循环自己写算法吗 自带函数有可以算的吗 或者网上的算法可以用的 python矩阵置怎么做?...5.矩阵置 给定:L=[[1,2,3],[4,5,6]] 用zip函数和列表推导式实现行列def transpose(L): T = [list(tpl) for tpl in zip(*L)] return...讨论: 你需要确保该数组的行列数都是相同的.比如: arr = [[1, 2, 3], [4, 5, 6], [7,8, 9], [10, 11, 12]] 列表递推式提供了一个简便的矩阵置的方法:...N的矩阵 就是说A=1 2 3 4 如何使用函数将A变成 B=1 2 3 4 5 有两种方法可以实现: 置矩阵: B = A’; 通用方法:reshape()函数 示例如下: 说明:reshape(...A,m,n) 表示将矩阵A变换为m行n的矩阵,通常用于矩阵形状的改变,例如下面代码将原来的1行4矩阵转换为2行2矩阵: length = 5matrix = [range(i*length, (i

5.5K50

pandas

版本太高 解决方法,使用openpyxl打开xlsx文件 df = pd.read_excel('鄱阳湖水文资料.xlsx',engine='openpyxl') 2、pandas索引问题 在Python...pandas中,从0开始行列索引 3.pandas 时间序列之pd.date_range() pd.date_range(python start=None,#开始时间 end=None...删除数据 用drop()或者del(),drop()可以不会对原数据产生影响(可以调);del()会删除原始数据 drop() 一次删除多行或多比较灵活 DataFrame.drop(labels,..._append(temp, ignore_index=True) pandas数据置 与矩阵相同,在 Pandas 中,我们可以使用 .transpose() 方法或 .T 属性来置 我们的DataFrame...通常情况下, 因为.T的简便性, 更常使用.T属性来进行置 注意 置不会影响原来的数据,所以如果想保存置后的数据,请将值赋给一个变量再保存。

2410

Python替代Excel Vba系列(三):pandas处理不规范数据

因此,本文将使用稍微复杂的数据做演示,充分说明 pandas 是如何灵活处理各种数据。 本文要点: 使用 pandas 处理不规范数据。 pandas 中的索引。...诸如"一1",表示是一年级1班,最多8个年级。 表格中的1至3,分别表示"星期"、"上下午"、"第几节课"。 前2有大量的合并单元格,并且数据量不一致。比如星期一有9行,但星期二却只有7行。...---- 处理标题 pandas 的 DataFrame 最大的好处是,我们可以使用列名字操作数据,这样子就无需担心的位置变化。因此需要把标题处理好。...这里不能直接整数,因为 python 怕有精度丢失,直接转换 int 会报错。因此先 float,再 int。...---- 数据如下: ---- ---- 最后 本文通过实例展示了如何在 Python使用 xlwings + pandas 灵活处理各种的不规范格式表格数据。

5K30

数据导入与预处理-课程总结-01~03章

0, 2]]) # 访问索引为[0, 2]的元素 2.3.3 使用布尔索引访问元素 布尔索引指以布尔值组成的数组或列表为索引。...当使用布尔索引访问数组时,会将布尔索引对应的数组或列表的元素作为索引,以获取索引为True时对应位置的元素。...与Python列表不同,数组在参与算术运算时无需遍历每个元素,便可以对每个元素执行批量运算,效率更高。...2.5.3 数组置 熟悉数组的置,可以通过T属性、transpose()方法、swapaxes()方法实现数组置操作 2.5.4 随机数生成 1. numpy的random库 python里随机数生成主要有两种方式...使用分层索引访问数据 掌握分层索引的使用方式,可以通过[]、loc和iloc访问Series类对象和DataFrame类对象的数据 pandas中除了可以通过简单的单层索引访问数据外,还可以通过复杂的分层索引访问数据

2.9K20

数据分析利器--Pandas

详解:标准安装的Python中用列表(list)保存一组值,可以用来当作数组使用,不过由于列表的元素可以是任何对象,因此列表中所保存的是对象的指针。...对于数值运算来说这种结构显然比较浪费内存和CPU计算时间。...与其它你以前使用过的(如R 的 data.frame)类似Datarame的结构相比,在DataFrame里的面向行和面向的操作大致是对称的。...在底层,数据是作为一个或多个二维数组存储的,而不是列表,字典,或其它一维的数组集合。因为DataFrame在内部把数据存储为一个二维数组的格式,因此你可以采用分层索引以表格格式来表示高维的数据。...(参考:NaN 和None 的详细比较) 3、pandas详解 3.1 简介: pandas是一个Python语言的软件包,在我们使用Python语言进行机器学习编程的时候,这是一个非常常用的基础编程库

3.6K30

python及numpy,pandas易混淆的点

首先python的工具包(类似于C的库函数)非常多,很多功能都有重复,所以选好包很重要,最简单的选择方法就是用时下最流行的包,社区比较活跃,遇到问题网上一搜很多答案,而且更新和维护也比较好。...这里和matlab或者C++或者fortran都很不一样,没有行优先或者优先的概念。但是numpy还有一个数据结构是mat。 个人觉得是为了便于使用以上语言的人们使用的。...例如mat结构可以非常方便地做置(matName.T),求逆(matName.I),求伴随矩阵(matName.A) pandas pandas的Series数据结构对象:类似于numpy的ndarray...可以把python字典类型的数据直接给Series对象,pandas会自动将key转换为index,data还是data。...在具体执行时,先比对index,相同index的数据相加,如果obj有某个index而obj1没有,则数据为NaN。

1.9K70

python及numpy,pandas易混淆的点

首先python的工具包(类似于C的库函数)非常多,很多功能都有重复,所以选好包很重要,最简单的选择方法就是用时下最流行的包,社区比较活跃,遇到问题网上一搜很多答案,而且更新和维护也比较好。...这里和matlab或者C++或者fortran都很不一样,没有行优先或者优先的概念。但是numpy还有一个数据结构是mat。 个人觉得是为了便于使用以上语言的人们使用的。...例如mat结构可以非常方便地做置(matName.T),求逆(matName.I),求伴随矩阵(matName.A) pandas pandas的Series数据结构对象:类似于numpy的ndarray...可以把python字典类型的数据直接给Series对象,pandas会自动将key转换为index,data还是data。...在具体执行时,先比对index,相同index的数据相加,如果obj有某个index而obj1没有,则数据为NaN。

2K50

干货!直观地解释和可视化每个复杂的DataFrame操作

Melt Melt可以被认为是“不可透视的”,因为它将基于矩阵的数据(具有二维)转换为基于列表的数据(列表示值,行表示唯一的数据点),而枢轴则相反。...诸如字符串或数字之类的非列表项不受影响,空列表是NaN值(您可以使用.dropna()清除它们 )。 ? 在DataFrame df中Explode“ A ” 非常简单: ?...要记住:从外观上看,堆栈采用表的二维性并将堆栈为多级索引。 Unstack 取消堆叠将获取多索引DataFrame并其进行堆叠,将指定级别的索引转换为具有相应值的新DataFrame的。...作为另一个示例,当级别设置为0(第一个索引级别)时,其中的值将成,而随后的索引级别(第二个索引级别)将成为转换后的DataFrame的索引。 ?...尽管可以通过将axis参数设置为1来使用concat进行列式联接,但是使用联接 会更容易。 请注意,concat是pandas函数,而不是DataFrame之一。

13.3K20

NumPy使用图解教程「建议收藏」

比如:如果数组表示的是以英里为单位的距离,我们的目标是将其转换为公里数。...数组的切片操作 我们可以像python列表操作那样NumPy数组进行索引和切片,如下图所示: 聚合函数 NumPy为我们带来的便利还有聚合函数,聚合函数可以将数据进行压缩,统计数组中的一些特征值:...NumPy这类运算采用对应位置(position-wise)操作处理: 对于不同大小的矩阵,只有两个矩阵的维度同为1时(例如矩阵只有一或一行),我们才能进行这些算术运算,在这种情况下,NumPy使用广播规则...我们可以像聚合向量一样聚合矩阵: 不仅可以聚合矩阵中的所有值,还可以使用axis参数指定行和的聚合: 矩阵的置和重构 处理矩阵时经常需要对矩阵进行置操作,常见的情况如计算两个矩阵的点积。...python中类似的结构是pandas数据帧(dataframe),它实际上使用NumPy来构建的。 音频和时间序列 音频文件是一维样本数组。每个样本都是代表一小段音频信号的数字。

2.7K30

图解NumPy:常用函数的内在机制

因此,常见的做法是要么先使用 Python 列表,准备好之后再将其转换为 NumPy 数组,要么是使用 np.zeros 或 np.empty 预先留下必要的空间: 通常我们有必要创建在形状和元素类型上与已有数组匹配的空数组...Python 列表与 NumPy 数组的对比,index() 中的方括号表示可以省略 j 或同时省略 i 和 j。...repeat: delete 可以删除特定的行和: 删除的逆操作为插入,即 insert: append 函数就像 hstack 一样,不能自动一维数组执行置,因此同样地,要么需要改变该向量的形状...矩阵排序 axis 参数虽然对上面列出的函数很有用,但对排序毫无用处: 使用 Python 列表和 NumPy 数组执行排序的比较 这通常不是你在排序矩阵或电子表格时希望看到的结果:axis 根本不能替代...根据你决定使用的 axis 顺序的不同,置数组所有平面的实际命令会有所不同:对于一般数组,它会交换索引 1 和 2, RGB 图像而言是 0 和 1: 置一个三维数据的所有平面的命令 不过有趣的是

3.3K20

图解NumPy:常用函数的内在机制

因此,常见的做法是要么先使用 Python 列表,准备好之后再将其转换为 NumPy 数组,要么是使用 np.zeros 或 np.empty 预先留下必要的空间: 通常我们有必要创建在形状和元素类型上与已有数组匹配的空数组...Python 列表与 NumPy 数组的对比,index() 中的方括号表示可以省略 j 或同时省略 i 和 j。...repeat: delete 可以删除特定的行和: 删除的逆操作为插入,即 insert: append 函数就像 hstack 一样,不能自动一维数组执行置,因此同样地,要么需要改变该向量的形状...矩阵排序 axis 参数虽然对上面列出的函数很有用,但对排序毫无用处: 使用 Python 列表和 NumPy 数组执行排序的比较 这通常不是你在排序矩阵或电子表格时希望看到的结果:axis 根本不能替代...根据你决定使用的 axis 顺序的不同,置数组所有平面的实际命令会有所不同:对于一般数组,它会交换索引 1 和 2, RGB 图像而言是 0 和 1: 置一个三维数据的所有平面的命令 不过有趣的是

3.6K10

【精心解读】用pandas处理大数据——节省90%内存消耗的小贴士

每种数据类型在pandas.core.internals模块中都有一个特定的类。pandas使用ObjectBlock类来表示包含字符串列的数据块,用FloatBlock类来表示包含浮点型的数据块。...由于pandas使用相同数量的字节来表示同一类型的每一个值,并且numpy数组存储了这些值的数量,所以pandas能够快速准确地返回数值型所消耗的字节量。...这对我们原始dataframe的影响有限,这是由于它只包含很少的整型。 同理,我们再浮点型进行相应处理: 我们可以看到所有的浮点型都从float64换为float32,内存用量减少50%。...在这之前,我们先来研究下与数值型相比,pandas如何存储字符串。 选对比数值与字符的储存 object类型用来表示用到了Python字符串对象的值,有一部分原因是Numpy缺少缺失字符串值的支持。...我们用sys.getsizeof()来证明这一点,先来看看在Python单独存储字符串,再来看看使用pandas的series的情况。

8.6K50

一键获取新技能,玩转NumPy数据操作

python的不少数据处理软件包依赖于NumPy作为其基础架构的核心部分(例如scikit-learn、SciPy、pandas和tensorflow)。...import numpy as np NumPy中的数组操作 创建数组 我们可以通过将python列表传入np.array()来创建一个NumPy数组(也就是强大的ndarray)。...比如:如果数组表示的是以英里为单位的距离,我们的目标是将其转换为公里数。可以简单的写作data * 1.6: ?...数组的切片操作 我们可以像python列表操作那样NumPy数组进行索引和切片,如下图所示: ?...python中类似的结构是pandas数据帧(dataframe),它实际上使用NumPy来构建的。 ? 音频和时间序列 音频文件是一维样本数组。每个样本都是代表一小段音频信号的数字。

1.8K10

一键获取新技能,玩转NumPy数据操作

python的不少数据处理软件包依赖于NumPy作为其基础架构的核心部分(例如scikit-learn、SciPy、pandas和tensorflow)。...import numpy as np NumPy中的数组操作 创建数组 我们可以通过将python列表传入np.array()来创建一个NumPy数组(也就是强大的ndarray)。...比如:如果数组表示的是以英里为单位的距离,我们的目标是将其转换为公里数。可以简单的写作data * 1.6: ?...数组的切片操作 我们可以像python列表操作那样NumPy数组进行索引和切片,如下图所示: ?...python中类似的结构是pandas数据帧(dataframe),它实际上使用NumPy来构建的。 ? 音频和时间序列 音频文件是一维样本数组。每个样本都是代表一小段音频信号的数字。

1.7K20

一键获取新技能,玩转NumPy数据操作!

python的不少数据处理软件包依赖于NumPy作为其基础架构的核心部分(例如scikit-learn、SciPy、pandas和tensorflow)。...import numpy as np NumPy中的数组操作 创建数组 我们可以通过将python列表传入np.array()来创建一个NumPy数组(也就是强大的ndarray)。...比如:如果数组表示的是以英里为单位的距离,我们的目标是将其转换为公里数。可以简单的写作data * 1.6: ?...数组的切片操作 我们可以像python列表操作那样NumPy数组进行索引和切片,如下图所示: ?...python中类似的结构是pandas数据帧(dataframe),它实际上使用NumPy来构建的。 ? 音频和时间序列 音频文件是一维样本数组。每个样本都是代表一小段音频信号的数字。

1.4K30

这是我见过最好的NumPy图解教程!没有之一

python的不少数据处理软件包依赖于NumPy作为其基础架构的核心部分(例如scikit-learn、SciPy、pandas和tensorflow)。...NumPy中的数组操作 创建数组 我们可以通过将python列表传入np.array()来创建一个NumPy数组(也就是强大的ndarray)。...比如:如果数组表示的是以英里为单位的距离,我们的目标是将其转换为公里数。可以简单的写作data * 1.6: ?...数组的切片操作 我们可以像python列表操作那样NumPy数组进行索引和切片,如下图所示: ?...python中类似的结构是pandas数据帧(dataframe),它实际上使用NumPy来构建的。 ? 音频和时间序列 音频文件是一维样本数组。每个样本都是代表一小段音频信号的数字。

1.7K40

安利!这是我见过最好的NumPy图解教程

python的不少数据处理软件包依赖于NumPy作为其基础架构的核心部分(例如scikit-learn、SciPy、pandas和tensorflow)。...NumPy中的数组操作 创建数组 我们可以通过将python列表传入np.array()来创建一个NumPy数组(也就是强大的ndarray)。...比如:如果数组表示的是以英里为单位的距离,我们的目标是将其转换为公里数。可以简单的写作data * 1.6: ?...数组的切片操作 我们可以像python列表操作那样NumPy数组进行索引和切片,如下图所示: ?...python中类似的结构是pandas数据帧(dataframe),它实际上使用NumPy来构建的。 ? 音频和时间序列 音频文件是一维样本数组。每个样本都是代表一小段音频信号的数字。

1.7K10
领券