首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

高效的10个Pandas函数,你都用过吗?

Insert Insert用于在DataFrame的指定位置中插入新的数据。默认情况下新添加到末尾的,但可以更改位置参数,将新添加到任何位置。...Ture表示允许新的列名与已存在的列名重复 接着用前面的df: 在第三的位置插入: #新的值 new_col = np.random.randn(10) #在第三位置插入0开始计算...Sample Sample用于DataFrame中随机选取若干个行或。...用法: DataFrame.loc[] 或者 DataFrame.iloc[] loc:按标签(columnindex)选择行 iloc:按索引位置选择行 选择df第1~3行、第1~2的数据...比如说给定三个元素[2,3,6],计算相差百分比后得到[NaN, 0.5, 1.0],第一个元素到第二个元素增加50%,第二个元素到第三个元素增加100%。

4.1K20
您找到你想要的搜索结果了吗?
是的
没有找到

20个能够有效提高 Pandas数据分析效率的常用函数,附带解释例子

Insert 当我们想要在 dataframe 里增加一数据时,默认添加在最后。当我们需要添加在任意位置,则可以使用 insert 函数。...使用该函数只需要指定插入的位置、列名称、插入的对象数据。...因此,行标签是0开始向上的整数。与iloc一起使用的行位置也是0开始的整数。 下述代码实现选择前三行前两的数据(iloc方式): df.iloc[:3,:2] ?...第一个元素到第二个元素增加了50%,第二个元素到第三个元素增加了100%。Pct_change函数用于比较元素时间序列中的变化百分比。 df.value_1.pct_change() ? 9....Describe describe函数计算数字的基本统计信息,这些包括计数、平均值、标准偏差、最小值最大值、中值、第一个第三个四分位数。因此,它提供了dataframe的统计摘要。 ?

5.6K30

Python写入Excel文件-多种实现方式(测试成功,附代码)

目录 xlsxwriter库储存数据到excel 简介 示例:写入excel 更多 添加工作表样式: 写入单元格数据 插入图片 写入超链接 插入图表 pandas库储存数据到excel..., data:要写入的数据(格式为一个列表), bold:单元格的样式 worksheet1.write_row(“A1”,data,bold) # A1:A1单元格开始插入数据,按插入, data...:要写入的数据(格式为一个列表), bold:单元格的样式 worksheet1.write_column(“A1”,data,bold) 插入图片 // 第一个参数是插入的起始单元格,第二个参数是图片你文件的绝对路径...pandas是专门为处理表格混杂数据设计的,而NumPy更适合处理统一的数值数组数据。 pandas有两个主要数据结构:SeriesDataFrame。...DataFrame DataFrame是一个表格型的数据类型,每值类型可以不同,是最常用的pandas对象。

3.9K10

Python自动化办公之Word批量转成自定义格式的Excel

这个dataFrame在控制台打印出来就是: ? 这个结构存入excel就是对应表格的行列了。这个结构就符合我的实际需求了。 ?...接着使用 for i in range(start, end): content = list[i] 就可以轮番list中取出每道题的各项内容,取到的第一个就加到dict的colomn1表中,...第二个就加到dict的colomn2中,按照这个规律,就能把list的内容分开插入到dict中的各个列表中了。...传的第二个参数是100,它就会自动生成1到100的字符串,用来匹配识别你的每道题的开头在哪个位置。...,它就会按照“.”去切割每一行的内容,拿到第一个“.”号前面的内容,用来跟它生成的匹配字符做比对,比对成功了,它就默认该行是你想要写到excel表格里的第一,接在它后面的每个段落,会自动插入到它后面的

1.6K40

Pandas 2.2 中文官方教程指南(八)

如果传递了索引/或,你将保证结果 DataFrame 的索引/或。因此,一个 Series 字典加上一个特定索引将丢弃所有与传递索引不匹配的数据。...数据对齐算术 DataFrame对象之间的数据对齐会自动在**索引(行标签)**上对齐。同样,结果对象将具有行标签的并集。...的name可以被自动赋值,特别是当DataFrame中选择单列时,name将被分配为标签。...数据对齐算术 DataFrame 对象之间的数据对齐会自动在**索引(行标签)**上对齐。同样,结果对象将具有行标签的并集。...数据对齐算术 DataFrame 对象之间的数据对齐会自动在索引(行标签)上进行对齐。同样,结果对象将具有行标签的并集。

24300

Python操作Excel

具体如下: pandas:数据处理最常用的分析库之一,可以读取各种各样格式的数据文件,一般输出dataframe格式,功能强大 openpyxl:主要针对xlsx格式的excel进行读取编辑 xlrd...库:excel中读取数据,支持xls、xlsx xlwt库:对excel进行修改操作,不支持对xlsx格式的修改 xlutils库:在xlwtxlrd中,对一个已存在的文件进行修改 xlwings:...对xlsx、xls、xlsm格式文件进行读写、格式修改等操作 xlsxwriter:用来生成excel表格,插入数据、插入图标等表格操作,不支持读取 Microsoft Excel API:需安装pywin32..."export.json") 文件写入 with open(filepath, 'w', encoding='utf-8') as f: f.write(content) f.close() 第二个参数可选...as pd from pandas import DataFrame file_path = r'.

1.3K30

几个高效Pandas函数

Insert Insert用于在DataFrame的指定位置中插入新的数据。默认情况下新添加到末尾的,但可以更改位置参数,将新添加到任何位置。...Ture表示允许新的列名与已存在的列名重复 在第三的位置插入: #新的值 new_col = np.random.randn(10) #在第三位置插入0开始计算 df.insert(2...Sample Sample用于DataFrame中随机选取若干个行或。...用法: DataFrame.loc[] # 或者 DataFrame.iloc[] loc:按标签(columnindex)选择行 iloc:按索引位置选择行 选择df第1~3行、第1~2的数据...比如说给定三个元素[2,3,6],计算相差百分比后得到[NaN, 0.5, 1.0],第一个元素到第二个元素增加50%,第二个元素到第三个元素增加100%。

1.5K60

进阶法宝!掌握这些 NumPy & Pandas 方法,快速提升数据处理效率

np.transpose(b) # 交换数组维度 >>> i.T 改变数组形状 >>> b.ravel() # 将数组压平 >>> g.reshape(3,-2) # 不会改变数据 添加删除数组元素...在数组中插入项 >>> np.delete(a,[1]) # 数组中删除项 合并数组 >>> np.concatenate((a,d),axis=0)# 连接数组 array([ 1, 2, 3...(by='Country') # 按轴上的值排序 >>> df.rank() 检索Series / DataFrame上的信息 基础信息 >>> df.shape # (行、) >>> df.index...# 描述指数 >>> df.columns # 描述DataFrame >>> df.info() # DataFrame信息 >>> df.count() # 非空值的个数 统计信息 >>...Join join方法提供了一个简便的方法用于将两个DataFrame中的不同的索引合并成为一个DataFrame

3.7K20

Pandas图鉴(三):DataFrames

df.dtypes返回的类型。 df.shape返回行的数量。 df.info()总结了所有相关信息 还可以将一个或几个设置为索引。...垂直stacking 这可能是将两个或多个DataFrame合并为一个的最简单的方法:你第一个DataFrame中提取行,并将第二个DataFrame中的行附加到底部。...注意:要小心,如果第二个表有重复的索引值,你会在结果中出现重复的索引值,即使左表的索引是唯一的 有时,连接的DataFrame有相同名称的。...就像原来的join一样,on与第一个DataFrame有关,而其他DataFrame是根据它们的索引来连接的。 插入删除 由于DataFrame是一个的集合,对行的操作比对的操作更容易。...例如,插入总是在原表进行,而插入一行总是会产生一个新的DataFrame,如下图所示: 删除也需要注意,除了del df['D']能起作用,而del df.D不能起作用(在Python层面的限制

36420

pandas

区别 Series是带索引的一维数组 Series对象的两个重要属性是:index(索引)value(数据值) DataFrame的任意一行或者一就是一个Series对象 创建Series对象:pd.Series...对象:pd.DataFrame(data,index,columns) 与Series不同的是,DataFrame包括索引index表头columns:   其中data可以是很多类型: 包含列表、字典或者...df.to_excel("dates.xlsx") 向pandas中插入数据 如果想忽略行索引插入,又不想缺失数据与添加NaN值,建议使用 df['column_name'].values得出的是...using .loc[row_indexer,col_indexer] = value instead 问题:当向列表中增加一时,需要先将变量复制一份,再添加才可以 a=a.copy()...1, inplace=True) # 删除0 2 4三    df del() 一次只能删除一 read_excel() data = pd.read_excel(r"Result_Model.xlsx

9910

盘一盘 Python 系列 4 - Pandas (下)

] 再被 stack(0) 之后变成 ( → 行) 行索引 = [r2, c] 索引 = r1 重塑后的 DataFrame 这时行索引有两层,第一层是代号,第二层是特征,而索引只有一层 (地区)...] 再被 stack(1) 之后变成 ( → 行) 行索引 = [r2, r1] 索引 = c 重塑后的 DataFrame 这时行索引有两层,第一层是代号,第二层是地区,而索引只有一层 (特征)...] 再被 stack(0) 之后变成 ( → 行) 行索引 = [r1, c] 索引 = r2 重塑后的 DataFrame 这时行索引有两层,第一层是地区,第二层是特征,而索引只有一层 (代号)...5.2 透视 数据源表通常只包含行,那么经常有重复值出现在各下,因而导致源表不能传递有价值的信息。这时可用「透视」方法调整源表的布局用作更清晰的展示。...因此我们需要做两件事: 只保留 'Date', 'Symbol' ‘Adj Close‘ ‘Date’ 中获取 ‘Year’ ‘Month’ 的信息插入表中 将处理过后的数据存在 data1

4.8K40
领券