首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas

需要注意是 loc 函数第一个参数不能直接传入整数,可以考虑送个列表进去 DataFrame.iloc[]访问 使用方法 loc 相似,主要区别是该函数在使用时对索引可以用索引号。...list 索引,值为 list 索引值 分组 Pandas 提供了 DataFrame.groupby()方法,按照指定分组键,将具有相同键值记录划分为同一组,将具有不同键值记录划分到不同组...,返回还是一个 dataframe,值有更改) 查找是否存在重复数据:df.duplicated()(返回布尔值,默认将已经观察到先前有之后行返回 True 这个需要调整 keep 函数,默认查找全部...,分别返回各个类别的记录数量,即频次,并根据 sort 值决定是否按频次排序。...将样本从小到大进行排列,按照样本位置将数据划分为位置间隔相等区间。位置间隔相同意味着样本出现频数相同。 获得每个区间第一个和最后一个元素值,两者差值即为该位置区间对应元素取值区间。

9.1K30
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas入门2

image.png 5.3 DataFrame和Series之间运算 默认情况下,DataFrame和Series之间算术运算会将Series索引匹配到DataFram,然后沿着行一直向下广播...image.png .读者可以复制下面代码运行,然后查看结果是否相同: from pandas import Series,DataFrame import numpy as np df = DataFrame...image.png .读者可以复制下面代码运行,然后查看结果是否相同: from pandas import Series,DataFrame import numpy as np df = DataFrame...image.png 7.2 日期时间类字符串相互转换 使用datetime模块中datatime对象strftime方法将时间转换为字符串,需要1个参数,参数为字符串格式。...image.png 7.3 Pandas中时间序列 pandas通常是用于处理成组日期,不管这个日期是DataFrame索引还是。to_datetime方法可以解析多种不同日期表示形式。

4.2K20

Pandas库常用方法、函数集合

需要连接数据库),输出dataframe格式 to_sql:向数据库写入dataframe格式数据 连接 合并 重塑 merge:根据指定键关联连接多个dataframe,类似sql中join concat...qcut:和cut作用一样,不过它是将数值等间距分割 crosstab:创建交叉表,用于计算两个或多个因子之间频率 join:通过索引合并两个dataframe stack: 将数据框“堆叠”为一个层次化...:对每个分组应用自定义聚合函数 transform:对每个分组应用转换函数,返回原始数据形状相同结果 rank:计算元素在每个分组中排名 filter:根据分组某些属性筛选数据 sum:计算分组总和...describe:生成分组描述性统计摘要 first和 last:获取分组中第一个和最后一个元素 nunique:计算分组中唯一值数量 cumsum、cummin、cummax、cumprod:...astype: 将一数据类型转换为指定类型 sort_values: 对数据框按照指定进行排序 rename: 对或行进行重命名 drop: 删除指定或行 数据可视化 pandas.DataFrame.plot.area

25610

【Python环境】Python中结构化数据分析利器-Pandas简介

二者Python基本数据结构List也很相近,其区别是:List中元素可以是不同数据类型,而Array和Series中则只允许存储相同数据类型,这样可以更有效使用内存,提高运算效率。...DataFrame是二维数据结构,其本质是Series容器,因此,DataFrame可以包含一个索引以及这些索引联合在一起Series,由于一个Series中数据类型是相同,而不同Series...因此对于DataFrame来说,每一数据结构都是相同,而不同之间则可以是不同数据结构。...从列表字典构建DataFrame,其中嵌套每个列表(List)代表是一个,字典名字则是标签。这里要注意是每个列表中元素数量应该相同。...df[0:3]df[0] 下标索引选取DataFrame记录,List相同DataFrame下标也是从0开始,区间索引的话,为一个左闭右开区间,即[0:3]选取为1-3三条记录。

15.1K100

首次公开,用了三年 pandas 速查表!

df.corr() # 返回之间相关系数 df.count() # 返回每一非空值个数 df.max() # 返回每一最大值 df.min() # 返回每一最小值 df.median...(axis=0) # 累积连加,累加 s.nunique() # 去重数量,不同值量 df.idxmax() # 每最大索引名 df.idxmin() # 最小 df.columns # 显示所有列名...df['增幅'] = df['国内生产总值'] - df['国内生产总值'].shift(-1) df.tshift(1) # 时间移动,按周期 # 和上相同,diff 函数是用来将数据进行移动之后原数据差...row[2]取 for row in df.itertuples():print(row) df.at[2018, '总人口'] # 按行列索引名取一个指定单个元素 df.iat[1, 2] # 索引编号取单个元素...') # 判断时间是否当天 pd.datetime.today().year == df.start_work.dt.year df.time.astype('datetime64[ns]').dt.date

7.4K10

进阶法宝!掌握这些 NumPy & Pandas 方法,快速提升数据处理效率

=0) # 对数组横轴元素进行排序 切片索引 获取单个元素 >>> a[2] # 选择第二个索引元素 3 >>> b[1,2] # 选择第1行第2元素(相当于b[1][2]) 1.5...获取帮助信息 >>> help(pd.Series.loc) 切片索引 获取元素 >>> s['b'] # 获取一个元素 -5 >>> df[1:] # 获取DataFrame子表 Country...id_vars: 不需要被转换列名。 value_vars: 需要转换列名,如果剩下全部都要转换,就不用写了。 var_name和value_name: 是自定义设置对应列名。...Join join方法提供了一个简便方法用于将两个DataFrame不同索引合并成为一个DataFrame。...其中参数意义merge方法基本相同,只是join方法默认为左外连接how=left。

3.7K20

python数据分析万字干货!一个数据集全方位解读pandas

目录 安装数据介绍 安装配置 检查数据 探索性分析 pandas数据结构 series对象 dataframe对象 访问series元素 使用索引 使用.loc.iloc 访问dataframe元素...colors.iloc[1]返回"purple"带有索引元素1。下图就显示.loc.iloc引用了哪些元素: ? 可以看出.loc指向图像右侧标签索引。而iloc指向图片左侧位置索引。...四、访问DataFrame元素 由于DataFrame由一系列对象组成,所以可以使用相同上面的方法来访问它元素。关键区别是DataFrame还有一些附加维度。...但是需要记住,DataFrame实际上是一个Series对象。...如果我们为选择正确数据类型,则可以显着提高代码性能。我们再看一下nba数据集: >>> df.info() ? 有十具有数据类型object。

7.4K20

掌握这些 NumPy & Pandas 方法,快速提升数据处理效率!

=0) # 对数组横轴元素进行排序 切片索引 获取单个元素 >>> a[2] # 选择第二个索引元素 3 >>> b[1,2] # 选择第1行第2元素(相当于b[1][2]) 1.5...获取帮助信息 >>> help(pd.Series.loc) 切片索引 获取元素 >>> s['b'] # 获取一个元素 -5 >>> df[1:] # 获取DataFrame子表 Country...id_vars: 不需要被转换列名。 value_vars: 需要转换列名,如果剩下全部都要转换,就不用写了。 var_name和value_name: 是自定义设置对应列名。...Join join方法提供了一个简便方法用于将两个DataFrame不同索引合并成为一个DataFrame。...其中参数意义merge方法基本相同,只是join方法默认为左外连接how=left。

4.9K20

Pandas笔记

DataFrame是一个类似于表格(有行有数据类型,可以理解为一个二维数组,索引有两个维度(行级索引索引),可更改。...DataFrame具有以下特点: 之间可以是不同类型 :不同数据类型可以不同 大小可变 (扩容) 标记轴(行级索引索引) 针对行进行轴向统计(水平,垂直) import pandas...(d) df['one'] df[df.columns[:2]] 添加 DataFrame添加一方法非常简单,只需要新建一个索引。...,要给出原有dataframeindex,不足时为NaN 删除 删除某数据需要用到pandas提供方法pop,pop方法用法如下: import pandas as pd d = {'one...找行方式,因为底层有赋值过程 # 如果通过行找,因为底层没有赋值过程,所以没有效果,不会修改成功 ⭐️复合索引 DataFrame行级索引索引都可以设置为复合索引,表示从不同角度记录数据

7.6K10

Pandas数据分析包

Series、Numpy中一维Array、Python基本数据结构List区别:List中元素可以是不同数据类型,而Array和Series中则只允许存储相同数据类型,这样可以更有效使用内存,...DataFrame既有行索引也有索引,它可以被看做由Series组成字典(共用同一个索引)。...如果某个索引值当前不存在,就引入缺失值 • 对于时间序列这样有序数据,重新索引时可能需要做一些插值处理。method选项即可达到此目的。 ?...#ffill用前一行相同数值填充 print(obj3.reindex(range(6), method = 'ffill')) print('对DataFrame重新指定索引') frame...对DataFrame进行索引其实就是获取一个或多个 为了在DataFrame行上进行标签索引,引入了专门索引字段ix。 ?

3.1K71

Python 金融编程第二版(二)

然而,科学和金融应用通常需要对特殊数据结构进行高性能操作。在这方面最重要数据结构之一是数组。数组通常以行和形式结构化其他(基本)相同数据类型对象。...然而,当将通用函数应用于 Python float对象时,需要注意math模块中相同功能性能降低。...要使用/强制数据类型;否则,它会被推断 copy bool,默认为None 从输入复制数据 结构化数组一样,正如我们已经看到那样,DataFrame对象具有可以直接通过分配具有正确数量元素list...② 做同样事情,但忽略了索引。 ③ 具有第一个相同效果,并且… ④ 第二个追加操作,分别。 连接 在连接这两个数据集时,DataFrame 对象顺序也很重要,但方式不同。...② 右连接颠倒 DataFrame 对象顺序相同。 ③ 内连接仅保留那些在两个索引中都找到索引值。 ④ 外连接保留来自两个索引所有索引值。 也可以基于空 DataFrame 对象进行连接。

11110

NumPy 秘籍中文第二版:十、Scikits 乐趣

除了将图像数据作为 2D 数组外,此过滤器还接受以下参数: 高斯分布标准差 下限阈值 上限阈值 操作步骤 我们将使用先前秘籍相同图像。...: 工作原理 我们使用了以下DataFrame方法: 函数 描述 pandas.DataFrame() 此函数使用指定数据,索引(行)和标签构造DataFrame。...在本教程中,我们将专注于铜数据集,其中包含有关铜价,世界消费量和其他参数信息。 准备 在开始之前,我们可能需要安装 patsy。 patsy 是描述统计模型库。 很容易看出这个库是否是必需。...DataSet对象具有名为exog属性,当作为 Pandas 对象加载时,该属性将成为具有多个DataFrame对象。 在我们案例中,它还有一个endog属性,其中包含世界铜消费量值。...根据下载报价数据创建索引,如下所示: dt_idx = pandas.DatetimeIndex(quotes.date) 获得日期时间索引后,我们将其收盘价一起使用以创建数据框: df = pandas.DataFrame

3K20

Pandas中文官档 ~ 基础用法1

Tail head() tail() 用于快速预览 Series DataFrame,默认显示 5 条数据,也可以指定要显示数量。...对于异质型数据,即 DataFrame 数据类型不一样时,就不是这种操作模式了。轴标签不同,不能为值属性赋值。...Index 还支持 divmod() 内置函数,该函数同时执行向下取整除模运算,返回两个左侧类型相同元组。...Use a.empty, a.any() or a.all(). ::: 了解详情,请参阅各种坑小节内容。 比较对象是否等效 一般情况下,多种方式都能得出相同结果。...该方法提取另一个 DataFrame 及合并器函数,并将之输入 DataFrame 对齐,再传递 Series 配对合并器函数(比如,名称相同)。

2.8K10

气象编程 |Pandas处理时序数据

时间序列数据是同一统一指标按时间顺序记录数据。在同一数据各个数据必须是同口径,要求具有可比性。时序数据可以是时期数,也可以时点数。...而言,如果已经按照时间顺序排好,则利用to_datetime可自动转换 df = pd.DataFrame({'year': [2020, 2020],'month': [1, 1], 'day':...min_periods参数是指需要非缺失数据点数量阀值 s.rolling(window=50,min_periods=3).mean().head() ?...shift/diff/pct_change都是涉及到了元素关系 ① shift是指序列索引不变,但值向后移动 ② diff是指前后元素差,period参数表示间隔,默认为1,并且可以为负 ③ pct_change...是值前后元素变化百分比,period参数diff类似 s.shift(2).head() ?

4.2K51

Pandas中文官档 ~ 基础用法

Tail head() tail() 用于快速预览 Series DataFrame,默认显示 5 条数据,也可以指定要显示数量。...对于异质型数据,即 DataFrame 数据类型不一样时,就不是这种操作模式了。轴标签不同,不能为值属性赋值。...Index 还支持 divmod() 内置函数,该函数同时执行向下取整除模运算,返回两个左侧类型相同元组。...Use a.empty, a.any() or a.all(). ::: 了解详情,请参阅各种坑小节内容。 比较对象是否等效 一般情况下,多种方式都能得出相同结果。...该方法提取另一个 DataFrame 及合并器函数,并将之输入 DataFrame 对齐,再传递 Series 配对合并器函数(比如,名称相同)。

2.3K20
领券