首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Python数据分析入门(六):Pandas层级索引

下面创建一个Series, 在输入索引Index时,输入了由两个子list组成的list,第一个子list是外层索引,第二个list是内层索引。...示例代码: import pandas as pd import numpy as np ser_obj = pd.Series(np.random.randn(12),index=[...示例代码: print(type(ser_obj.index)) print(ser_obj.index) 运行结果: <class 'pandas.indexes.multi.MultiIndex'...labels=[[0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3], [0, 1, 2, 0, 1, 2, 0, 1, 2, 0, 1, 2]]) 选取子集 根据索引获取数据...因为现在有两层索引,当通过外层索引获取数据的时候,可以直接利用外层索引的标签来获取。 当要通过内层索引获取数据的时候,在list中传入两个元素,前者是表示要选取的外层索引,后者表示要选取的内层索引

53830

Python数据分析实战基础 | 灵活的Pandas索引

据不靠谱的数据来源统计,学习了Pandas的同学,有超过60%仍然投向了Excel的怀抱,之所以做此下策,多半是因为刚开始用Python处理数据时,选择想要的行和列实在太痛苦,完全没有Excel想要哪里点哪里的快感...第一篇潘大师(初识Pandas)教程考虑到篇幅问题只讲了最基础的列向索引,但这显然不能满足同志们日益增长的个性化服务(选取)需求。...思路:手指戳屏幕数一数,一级的渠道,是从第1行到第13行,对应行索引是0-12,但Python切片默认是含首不含尾的,要想选取0-12的索引行,我们得输入“0:13”,列想要全部选取,则输入冒号“:”即可...在loc方法中,我们可以把这一列判断得到的值传入行参数位置,Pandas会默认返回结果True的行(这里是索引从0到12的行),而丢掉结果False的行,直接上例子: ?...只要稍加练习,我们就能够随心所欲的用pandas处理和分析数据,迈过了这一步之后,你会发现和Excel相比,Python是如此的美艳动人。

1.1K20

如何在 Python 数据中灵活运用 Pandas 索引

参考链接: 用Pandas建立索引并选择数据 作者 | 周志鹏  责编 | 刘静  据不靠谱的数据来源统计,学习了Pandas的同学,有超过60%仍然投向了Excel的怀抱,之所以做此下策,多半是因为刚开始用...Python处理数据时,选择想要的行和列实在太痛苦,完全没有Excel想要哪里点哪里的快感。 ...思路:手指戳屏幕数一数,一级的渠道,是从第1行到第13行,对应行索引是0-12,但Python切片默认是含首不含尾的,要想选取0-12的索引行,我们得输入“0:13”,列想要全部选取,则输入冒号“:”即可...在loc方法中,我们可以把这一列判断得到的值传入行参数位置,Pandas会默认返回结果True的行(这里是索引从0到12的行),而丢掉结果False的行,直接上例子:  场景二:我们想要把所有渠道的流量来源和客单价单拎出来看一看...只要稍加练习,我们就能够随心所欲的用pandas处理和分析数据,迈过了这一步之后,你会发现和Excel相比,Python是如此的美艳动人。

1.7K00

利用Python进行数据分析(11) pandas基础: 层次化索引

层次化索引 层次化索引是你能在一个数组上拥有多个索引,例如: ? 有点像Excel里的合并单元格对么? 以外层索引的方式选择数据子集: ? 以内层索引的方式选择数据: ?...层次化索引数据重塑和分组中扮演着很重要的角色,例如,上面的层次化索引数据可以转换为一个DataFrame: ? 对于一个DataFrame,横轴和竖轴都可以有层次化索引,例如: ?...重排分级顺序 swaplevel()函数可以将两个级别的数据进行交换,例如: ? sortlevel()函数根据单个级别的值对数据进行排序,例如: 以行按第一层进行排序: ?...根据级别汇总统计 多层次索引数据,汇总的时候可以单独按照级别进行,例如: ?

47420

python 数据分析基础 day15-pandas数据的使用获取方式1:使用DataFrame.loc

今天是读《pyhton数据分析基础》的第15天,今天读书笔记的内容使用pandas模块的数据类型。 数据(DataFrame)类型其实就是带标题的列表。...很多时候,整个数据数据并不会一次性的用于某一部的分析,而是选用某一列或几列的数据进行分析,此时就需要获取数据的部分数据。...获取方式如下: 获取方式1:使用DataFrame.loc[] #调用某两行两列交汇的数据 #[index1,index2]表示引用索引号为index1和index2的两行数据 #[colName1,colName2...]表示引用列标题为colName1和colName2的列数据 DataFrame.loc[[index1,index2],[colName1,colName2]] 获取方式2:使用DataFrame.iloc...[] #调用某两行两列交汇的数据 #索引号从0开始算,若为连续的行数,则算头不算尾 #以下行代码所选取的数据相同 #1:3、[1,2]表示行索引号,选取第二行和第三行 #3:5、[3,4]表示列索引号,

1.7K110

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

Pandas 中,索引可以设置一个(或多个)唯一值,这就像在工作表中有一列用作行标识符一样。与大多数电子表格不同,这些索引值实际上可用于引用行。...要使更改“保持不变”,您需要分配给一个变量。 sorted_df = df.sort_values("col1") 或覆盖原来的。...在 Pandas 中,您使用特殊方法从/向 Excel 文件读取和写入。 让我们首先基于上面示例中的数据,创建一个的 Excel 文件。 tips.to_excel("....pandas 通过在 DataFrame 中指定单个系列来提供矢量化操作。可以以相同的方式分配列。DataFrame.drop() 方法从 DataFrame 中删除一列。...可以通过多种方式过滤数据,其中最直观的是使用布尔索引

19.5K20

分析你的个人Netflix数据

通过使用PythonPandas编程,我们现在可以得到这个问题的具体答案:我花了多少时间看《老友记》?我们来看看吧。...第3步:把你的数据加载到一个Jupyter笔记本中 我们将导入pandas库并将Netflix数据CSV读入pandas数据: import pandas as pd df = pd.read_csv...我们可以用df.dtypes快速获取数据中每列的数据类型列表,执行: df.dtypes ? 正如我们在这里看到的,这三列都存储object,这意味着它们是字符串。...但我们还有一个数据准备任务要处理:过滤标题列 我们有很多方法可以进行过滤,但是出于我们的目的,我们将创建一个名为friends的数据,并仅用标题列包含“friends”的行填充它。...我们将从一个小的准备工作开始,这将使这些任务更加简单:“weekday”和“hour”创建的列。.

1.7K50

Python3分析Excel数据

使用列标题 使用列索引值 用pandas设置数据,在方括号中列出要保留的列的索引值或名称(字符串)。...设置数据和iloc函数,同时选择特定的行与特定的列。如果使用iloc函数来选择列,那么就需要在列索引值前面加上一个冒号和一个逗号,表示这些特定的列保留所有的行。...当在每个数据中筛选特定行时,结果是一个的筛选过的数据,所以可以创建一个列表保存这些筛选过的数据,然后将它们连接成一个最终数据。 在所有工作表中筛选出销售额大于$2000.00的所有行。...工作簿的每个工作表计算统计量,并将结果连接成一个数据。...当所有工作簿级的数据都进入列表后,将这些数据连接成一个独立数据,并写入输出文件。 pandas_sum_average_multiple_workbook.py #!

3.3K20

Python只需要三分钟即可精美地可视化COVID-19数据

我们将根据URL将数据加载到Pandas数据中,以便每天自动我们更新。...本文中我们将使用Pandas和Matplotlib。 在第二步中,我们将数据读入数据df,然后仅选择列表中的countries。选择数据使结果可视化更具可读性。...数据可视化准备我们的数据 现在我们已经将数据存储在一个数据中,让我们准备另外两个数据,这些数据将我们的数据保存在交叉表中,这将使我们能够更轻松地可视化数据。...在第四步中,我们df对数据进行数据透视,将案例数作为数据字段在国家/地区之外创建列。这个数据称为covid。然后,我们将数据索引设置日期,并将国家/地区名称分配给列标题。...在第七步中,我们使用Pandas的绘图功能创建了第一个可视化。我们使用colors参数将颜色分配给不同的列。我们还使用该set_major_formatter方法以数千个分隔符设置值的格式。

2.6K30

PythonforResearch | 2_数据处理

过滤数据 conditon是每行的True或者False值序列(因此condition的长度必须和 dataframe 行的长度相同) 在 Pandas 中,只需在整个列上编写一个布尔表达式,就可以为每一行生成...如果我们要将其保留单独的 dataframe,则必须像这样分配它: df_auto_small = df_auto[(df_auto.price < 3800) & (df_auto.foreign...pricetrunkprice_trunk_ratio556229.06.01038.166667474934.07.0704.857143446486.08.0810.750000234389.09.0487.666667173667.07.0523.857143 通过遍历(iterate)每行数据来生成列...如果要将每个组汇总到数据中的一行,则可以使用以下两个示例中的许多选项: grouped.sum() 和 gropued.mean() grouped.sum() pricempgheadroomtrunkweightlengthforeign...) 示例 2:堆叠与去堆叠(Stack and Unstack) Stack和Unstack是高级操作符,用于基于多级索引来重塑数据

4K30

pandas操作excel全总结

pandas是基于Numpy创建的Python包,内置了大量标准函数,能够高效地解决数据分析数据处理和分析任务,pandas支持多种文件的操作,比如Excel,csv,json,txt 文件等,读取文件之后...首先,了解下pandas中两个主要的数据结构,一个是Series,另一个是DataFrame。 Series一种增强的一维数组,类似于列表,由索引(index)和值(values)组成。...pandas读取excel pandas读取文件之后,将内容存储DataFrame,然后就可以调用内置的各种函数进行分析处理。...默认是'\t'(也就是tab)切割数据集的 header:指定表头,即列名,默认第一行,header = None, 没有表头,全部数据内容 encoding:文件编码方式,不设置此选项, Pandas...index_col ,指定索引对应的列为数据的行标签,默认 Pandas 会从 0、1、2、3 做自然排序分配给各条记录。

20.9K43

使用Python分析数据并进行搜索引擎优化

我们可以使用pandas库的DataFrame方法,来将结果列表转换为一个数据,方便后续的分析和搜索引擎优化。...("bing_data.csv", index=False) 9.分析结果并进行搜索引擎优化我们可以使用pandas库的read_csv方法,来读取保存好的csv文件,得到一个数据。...我们可以使用pandas库的head方法,来查看数据的前几行,了解数据的结构和内容。我们可以使用pandas库的shape属性,来查看数据的行数和列数,了解数据的规模。...我们可以使用pandas库的describe方法,来查看数据的基本统计信息,了解数据的分布和特征。...# 分析结果并进行搜索引擎优化# 使用pandas库的read_csv方法,读取保存好的csv文件,得到一个数据df = pd.read_csv("bing_data.csv")# 使用pandas库的

20520

从小白到大师,这里有一份Pandas入门指南

Pandas 是一个「开源的、有 BSD 开源协议的库,它为 Python 编程语言提供了高性能、易于使用的数据架构以及数据分析工具」。...在内部,Pandas数据存储不同类型的 numpy 数组(比如一个 float64 矩阵,一个 int32 矩阵)。 有两种可以大幅降低内存消耗的方法。...如果你只想检索一次数据(这种情况很少发生),查询是正确的方法。否则,你一定要坚持用索引,CPU 会为此感激你的。 .set_index(drop=False) 允许不删除用作索引的列。...否则,对于 DataFrame 中的每一个行,Pandas 都会更新索引,这可不是简单的哈希映射。...source=post_page--------------------------- 除了文中的所有代码外,还包括简单数据索引数据(df)和多索引数据(mi_df)性能的定时指标。 ?

1.8K11
领券