shape对应位置为1 3.矩阵乘法api np.dot --点乘 np.matmul -- 矩阵相乘 注意:两者之间在进行矩阵相乘时候...,没有区别 但是,dot支持矩阵和数字相乘 5.Pandas 5.1Pandas介绍 1.pandas概念 开源的数据挖掘库 用于数据探索...对象.values 对象.T 对象.head() 对象.tail() 2.dataframe设置索引...对象.set_index() 如果设置索引是两个的时候就是multiIndex 4.MultiIndex和panel -- 类比三维数组...[**] 1.MultiIndex 对象.index 对象.index.names 2.panel -- 已经弃用,了解
今天说一说Python数据分析pandas之多层高维索引,希望能够帮助大家进步!!!...DataFrame多层索引 多层索引简介 众所周知Pandas的Series和DataFrame存放的是一维和二维数组,那么想存放多维数组就得通过多层索引来实现。...李四 55 2011 李四 45 2012 李四 35 访问多层索引 给索引命名 索引如果不指定名字,默认是None,我们可以通过dataframe的index.names...此代码由Java架构师必看网-架构君整理 #通过index.names给索引赋值 import pandas as pd index=[['期中','期末'],[2010,2011,2012]] index...2 xs在访问索引时需要指定要查询的具体key值,否则会报错。 3 xs在访问索引时需要指定对应的level,否则会报错。
后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 前言 本系列上一篇文章关于合并多个 Excel 数据,许多小伙伴似乎对此比较感兴趣,问我是否可以合并不规范的数据...,用指定的表头查找,只要某一行有大于等于2个符合的内容,则这行作为标题 - x_df.columns = x_df.loc[header_idx] ,通过 DataFrame.columns 可以轻松设置其表头...loc[:,cols]:获取指定的列 > 这里涉及多种 pandas 知识,希望系统学习这些知识,我只能推荐你去看看我的 pandas 专栏 看看怎么调用吧: - 这里的代码与本系列上一节基本一样...- 在使用 pd.read_excel 加载数据时,设置 header=None (红线) ,让其不把任何数据设置为表头 - 加载数据后,调用之前定义的方法 reset_header 调整表格(绿线)...总结 真的不要再误以为 pandas 只能处理非常规范的数据了,这是一个类似于 Sql 的声明式数据处理分析库,同时也能使用任何命令式来细致处理数据。
标签:Python与Excel,pandas 我们之前讨论了如何在pandas中创建计算列,并讲解了一些简单的示例。...那么,在列中对每个学生进行循环?不!记住,我们永远不应该循环遍历pandas数据框架/系列,因为如果我们有一个大的数据集,这样做效率很低。...pandas applymap()方法 pandas提供了一种将自定义函数应用于列或整个数据框架的简单方法,就是.applymap()方法,这有点类似于map()函数的作用。...注意下面的代码,我们只在包含平均值的三列上应用函数。因为我们知道第一列包含字符串,如果我们尝试对字符串数据应用letter_grade()函数,可能会遇到错误。...图3 我们仍然可以使用map()函数来转换分数等级,但是,需要在三列中的每一列上分别使用map(),而applymap()能够覆盖整个数据框架(多列)。
] 根据行列的标签位置选择单个标量值 df.iat[i, j] 根据行列的整数位置选择单个标量值 reindex方法 通过标签选择行和列 get_value, set_value方法 根据行和列的标签设置单个值...在pandas库的简单介绍(1)已经介绍过Series对象相加的例子,这里说明一下DataFrame对象的加减。...同样的,也可以在重建索引指定填充值。...() - x.min() print('行上计算:\n', frame.apply(f)) #默认在行上进行计算 frame.apply(f, axis = 'columns') #传入columns在列上计算...在sort_index中,可以传入axis参数和ascending参数进行排序,默认按索引升序排序,当为frame1.sort_index(axis=1, ascending=False)表示在列上降序排列
目录 Pandas 排序方法入门 准备数据集 熟悉 .sort_values() 熟悉 .sort_index() 在单列上对 DataFrame 进行排序 按升序按列排序 更改排序顺序 选择排序算法...在多列上对 DataFrame 进行排序 在数据分析中,通常希望根据多列的值对数据进行排序。想象一下,您有一个包含人们名字和姓氏的数据集。...在第一个示例中,您在名为 的单个列上对 DataFrame 进行了排序city08。从分析的角度来看,城市条件下的 MPG 是决定汽车受欢迎程度的重要因素。...在 Pandas 中排序时处理丢失的数据 通常,现实世界的数据有很多缺陷。虽然 Pandas 有多种方法可用于在排序前清理数据,但有时在排序时查看丢失的数据还是不错的。...默认情况下,此参数设置为last,将NaN值放置在排序结果的末尾。要改变这种行为,并在你的数据帧先有丢失的数据,设置na_position到first。
完整学习教程已开源,开源链接: https://github.com/datawhalechina/joyful-pandas 文件的读取和写入 import pandas as pdimport numpy.../table.csv')df.head()#读取txt文件,直接读取可能会出现数据都挤在一列上df_txt = pd.read_table('./data.....75, .95])# 非数值型特征需要单独调用describe方法df['Physics'].describe() 5. idxmax & nlargest idxmax函数返回最大值对应的索引,在某些情况下特别适用...索引排序 #set_index函数可以设置索引,将在下一章详细介绍df.set_index('Math').head() #可以设置ascending参数,默认为升序,Truedf.set_index...在常用函数一节中,由于一些函数的功能比较简单,因此没有列入,现在将它们列在下面,请分别说明它们的用途并尝试使用。 ? 5. df.mean(axis=1)是什么意思?
Pandas的query函数为我们提供了一种编写查询过滤条件更简单的方法,特别是在的查询条件很多的时候,在本文中整理了10个示例,掌握着10个实例你就可以轻松的使用query函数来解决任何查询的问题。...在后端Pandas使用eval()函数对该表达式进行解析和求值,并返回表达式被求值为TRUE的数据子集或记录。所以要过滤Pandas中的DataFrame,需要做的就是在查询函数中指定条件即可。...与数值的类似可以在同一列或不同列上使用多个条件,并且可以是数值和非数值列上条件的组合。 除此以外, Pandas中的query()方法还可以在查询表达式中使用数学计算。...我们还可以在一个或多个列上包含一些复杂的计算。...OrderDate.dt.month == 8 and OrderDate.dt.year == 2021 and OrderDate.dt.day >=15") output dt很好用并且可以在同一列上结合了多个条件
Python 数据分析 NumPy 上 NumPy 下 Pandas 上 Pandas 下 SciPy 上 SciPy 下 Pandas 时间序列 Pandas 高频数据采样 默顿模型计量经济资本 LSMC...因此学会 Python 工具做可视化是一项非常重要的技能,在 Python 众多画图工具中,Matplotlib 一定是最早应该学习的。下图类比人类和 Matplotlib 画图三部曲。...图 → 坐标系 → 坐标轴 → 刻度 由上图看出: 图包含着坐标系 (多个) 坐标系由坐标轴组成 (横轴 xAxis 和纵轴 yAxis) 坐标轴上面有刻度 (主刻度 MajorTicks 和副刻度...在坐标轴和刻度上添加标签 在坐标系中添加线、点、网格、图示、标记和文字 在图中添加标题 理解了 Matplotlib 里面的绘图逻辑和元素后,再可以分别从不同维度 (深度和广度) 研究画图: 深度探索:...研究折线图,但根据需求不断更新设置添加元素完善它,深度研究做到完美!
大家好,我是俊欣 Pandas的query函数为我们提供了一种编写查询过滤条件更简单的方法,特别是在的查询条件很多的时候,在本文中整理了10个示例,掌握着10个实例你就可以轻松的使用query函数来解决任何查询的问题...在后端Pandas使用eval()函数对该表达式进行解析和求值,并返回表达式被求值为TRUE的数据子集或记录。所以要过滤Pandas中的DataFrame,需要做的就是在查询函数中指定条件即可。...与数值的类似可以在同一列或不同列上使用多个条件,并且可以是数值和非数值列上条件的组合。 除此以外, Pandas中的query()方法还可以在查询表达式中使用数学计算。...我们还可以在一个或多个列上包含一些复杂的计算。...OrderDate.dt.month == 8 and OrderDate.dt.year == 2021 and OrderDate.dt.day >=15") output dt很好用并且可以在同一列上结合了多个条件
如上图的 out[24] 中所示,如果你从一个 Python 字典对象创建 Series,Pandas 会自动把字典的键值设置成 Series 的 index,并将对应的 values 放在和索引对应的...如上,如果 Pandas 在两个 Series 里找不到相同的 index,对应的位置就返回一个空值 NaN。...我们可以用 .index.names 给它们加上名字: ? 交叉选择行和列中的数据 我们可以用 .xs() 方法轻松获取到多级索引中某些特定级别的数据。...清洗数据 删除或填充空值 在许多情况下,如果你用 Pandas 来读取大量数据,往往会发现原始数据中会存在不完整的地方。...在 DataFrame 中缺少数据的位置, Pandas 会自动填入一个空值,比如 NaN或 Null 。
pandas.的query函数为我们提供了一种编写查询过滤条件更简单的方法,特别是在的查询条件很多的时候,在本文中整理了10个示例,掌握着10个实例你就可以轻松的使用query函数来解决任何查询的问题。...在后端pandas使用eval()函数对该表达式进行解析和求值,并返回表达式被求值为TRUE的数据子集或记录。所以要过滤pandas DataFrame,需要做的就是在查询函数中指定条件即可。...与数值的类似可以在同一列或不同列上使用多个条件,并且可以是数值和非数值列上条件的组合。 除此以外, Pandas Query()还可以在查询表达式中使用数学计算。...我们还可以在一个或多个列上包含一些复杂的计算。...df.query("OrderDate.dt.month == 8 and OrderDate.dt.year == 2021 and OrderDate.dt.day >=15") DT很好用并且可以在同一列上结合了多个条件
pandas.的query函数为我们提供了一种编写查询过滤条件更简单的方法,特别是在的查询条件很多的时候,在本文中整理了10个示例,掌握着10个实例你就可以轻松的使用query函数来解决任何查询的问题。...所以要过滤pandas DataFrame,需要做的就是在查询函数中指定条件即可。 使用单一条件进行过滤 在单个条件下进行过滤时,在Query()函数中表达式仅包含一个条件。...与数值的类似可以在同一列或不同列上使用多个条件,并且可以是数值和非数值列上条件的组合。...我们还可以在一个或多个列上包含一些复杂的计算。...df.query("OrderDate.dt.month == 8 and OrderDate.dt.year == 2021 and OrderDate.dt.day >=15") DT很好用并且可以在同一列上结合了多个条件
4 pandas基本功能 4.1-4.5见之前文章 4.6 排名 排名这个功能目前我用的不怎么多,但还是简单说明一下。排名用到了rank方法。...---- 5 描述性统计概述与计算 5.1 描述性统计和汇总统计 pandas对象有一个常用数学、统计学方法的集合,大部分属于规约和汇总统计,并且还有处理缺失值的功能。...2.000000 -2.500000 75% 4.500000 -2.250000 max 7.000000 -2.000000 对于任何方法,都有axis和skipna这两个参数,在具体情况中具体使用...1.0 4 1.0 1.0 0.0 5 2.0 0.0 1.0 100 1.0 1.0 0.0 101 0.0 0.0 1.0 如结果所示,行标签为所有列的不同值,数值则是不同值在每个列出现次数...至此,pandas基础操作已经全部完成,熟练运用这些方法能大大减少编程的复杂度,也能提高效率;下一篇将对时间类型做一个专题。
可视化原理是将一系列多维空间的点通过非线性方法映射到二维空间的可视化技术,是基于圆形平行坐标系的设计思想而提出的多维可视化方法。...圆形的m条半径表示m维空间,使用坐标系中的一点代表多为信息对象,其实现原理参照物理学中物体受力平衡定理。...表明删除数据,axis=0表示删除行,axis=1表示删除列,这里表明去掉最后一列表示类别的列 (2)pandas.DataFrame.apply 调用函数...) 扩展维数,当axis=0时,扩展列,即在行上增加数据;[1,2]变为[[1,2]] 当axis=1时,扩展行,即在列上增加数据...表示每个元素的复制次数 当axis=0时,列不变,在行上复制元素;[[1],[2]]变为[[1],[1],[2],[2]] 当axis=1时,行不变,在列上复制元素
从技术上来讲,可以通过pandas的rolling方法,以指定时间窗口的方式来计算移动均值,在如下的CalMA.py范例中,就将演示通过收盘价,演示通过rolling方法计算移动平均线的做法。...请注意在第8行和第9行绘制两条折线时,均通过label参数设置了图例,所以在之后的第10行里,能通过legend方法设置图例效果。...另外值得注意的可视化细节还有,在第11行里,通过grid方法设置了网格线,通过第12行和第13行的代码设置了中文标题,在第14行里指定了x轴坐标文字标签需要旋转30度。...自相关性在统计学上有什么意义呢? 如果时间序列上,两个相近的值不相关,即相关系数为0,则表示该时间序列上的各个点间没有关联,那么就没有必要再通过观察规律来预测未来的数据。...该方法的use_vlines参数表示是否要设置点到x轴的连线,这里取值是True,表示需要设置,lags参数表示计算当天数据到后面50天的自相关系数,而title参数则表示该图表的标题。
什么是平行坐标系图 平行坐标系图是一种多维数据可视化技术,通过将数据的不同特征(维度)表示为平行的坐标轴,以便在不同维度之间进行比较。...数据准备 首先,让我们创建一个示例数据集,用于绘制平行坐标系图。我们将使用Pandas库来生成一个包含不同特征的虚构数据集。...import pandas as pd import numpy as np # 创建示例数据集 data = { 'Feature1': np.random.rand(100) * 100,...定制平行坐标系图 平行坐标系图提供了许多定制选项,以便更好地呈现数据。以下是一些示例定制选项: 颜色:你可以为不同的特征线段指定不同的颜色。 透明度:通过设置线段的透明度,可以减少重叠线段的混淆。...在本文中,我们介绍了如何使用Matplotlib创建平行坐标系图,包括生成示例数据集、绘制图表以及定制图表。你可以根据自己的需求和数据来进一步扩展和定制平行坐标系图,以更好地理解和传达数据。
后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 前言 本系列上一节文章最后我随手使用了 pandas 中的透视表操作,之后有些小伙伴询问我相关的问题。...- 把 sex 字段拖入 行标签,survived 字段拖入 列标签 - 还需要统计人数,人名总是有的,因此把 name 字段拖入 数值区域 - 透视表立刻出结果,行标签 放入的字段的唯一值,被显示在透视表左侧...列标签 放入的字段的唯一值,被显示在透视表的上方 只看数值看不出门路,设置百分比吧: - 点中透视表任意一格,鼠标右键 - 按上图指示完成 - 女性 生还率远高于 男性!!...: - 参数 margins 默认为 False,显示总计行列 - 参数 margins_name ,设置总计行列的索引值 > 实际上很少需要使用这2个参数,因为 pandas 中添加这2列是非常简单..."Excel 透视表是百分比呀" pandas 透视表功能没有参数设置,因为本身透视出来的还是一个 DataFrame ,这可以利用之前学到的一切技巧来为这个 DataFrame "添油加醋":
领取专属 10元无门槛券
手把手带您无忧上云