首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas班拆分Excel文件+班排名级排名

Pandas groupby rank, 今天学习有: 1。用pandas.groupby+apply+to_excel进行‘班别’列对一个Excel文件拆分成一个班一个文件的操作。...简单又强大 2.pandas+groupby+rank利用总分班排名与级排名 原数据表 # -*- coding: UTF-8 -*- import pandas as pd df=pd.read_excel..._1.xlsx') """ print(df) #在列的方向上删除‘学号’‘语文’ df=df.drop(['学号','语文'],axis=1) print(df) #在列的方向上删除index为1 2...的整行数据 df=df.drop([1,2],axis=0) print(df) """ #f=df.groupby(['班别']).get_group(901) #print(f) #班别拆分开另存了一个班一个...x.name}.xlsx',index=False)) #按语文成绩排名,并添加‘语名’并输入数字 #df['语名']=df['语文'].rank(ascending=0,method='dense') #只是数学成绩排名

1.1K30
您找到你想要的搜索结果了吗?
是的
没有找到

不支持连续分隔符当作一个处理?这个方法很多人没想到!|PQ实战

在做数据分列的时候,如果碰到分隔符连续出现的情况,比如用空格分列的时候,有的地方连续几个空格,那到底是分成几个,还是只当做一个来处理?...- 1 - 数字到非数字转换拆分 显然,PQ里目前是没有直接设置相应选项的处理方式的,但是,我们可以换一个可能很多人没有想到的思路:连续分隔符的问题,跟数字(分隔符)到非数字(分隔符)的转换不是一个道理吗...实际上就是,分列的时候怎么知道要分几列? 其实我不知道,而是事先通过其他操作步骤得到的。...具体如下: Step-01 重复列 Step-02 空格分列到行 Step-03 筛选去掉空内容 Step-04 分组统计行数 Step-05 统计最大值 通过上面的操作,即可得到最大会分成几列。...- 2 - 行后筛选再分组加索引透视 Step-01 重复列 Step-02 空格分列到行 Step-03 筛选去掉空内容 Step-04 分组加索引 修改步骤公式如下: 展开得到添加好索引的结果。

12310

我用Python展示Excel中常用的20个操

],inplace=True),可以发现Excel处理的结果一致,保留了 629 个唯一值。...PandasPandas中可以使用.split来完成分列,但是在分列完毕后需要使用merge来将分列完的数据添加至原DataFrame,对于分列完的数据含有[]字符,我们可以使用正则或者字符串lstrip...数据分组 说明:对数据进行分组计算 Excel 在Excel中对数据进行分组计算需要先对需要分组的字段进行排序,之后可以通过点击分类汇总并设置相关参数完成,比如对示例数据的学历进行分组并求不同学历的平均薪资...PandasPandas中对数据进行分组计算可以使用groupby轻松搞定,比如使用df.groupby("学历").mean()一行代码即可对示例数据的学历进行分组并求不同学历的平均薪资,结果与Excel...数据抽样 说明:对数据要求采样 Excel 在Excel中抽样可以使用公式也可以使用分析工具库中的抽样,但是仅支持对数值型的列抽样,比如随机抽20个示例数据中薪资的样本 ?

5.5K10

Pandas 进行数据处理系列 二

获取指定的列行 import pandas as pd df = pd.read_csv('xxxx.xls') 获取行操作df.loc[3:6]获取列操作df['rowname']取两列df[['...loc函数标签值进行提取iloc位置进行提取ix可以同时标签位置进行提取 具体的使用见下: df.loc[3]索引提取单行的数值df.iloc[0:5]索引提取区域行数据值df.reset_index...df.groupby(‘city’).count() city 列分组后进行数据汇总df.groupby(‘city’)[‘id’].count() city 进行分组,然后汇总 id 列的数据df.groupby...city 进行分组,然后计算 pr 列的大小、总和和平均数 数据统计 数据采样,计算标准差、协方差相关系数。..., 250, 250, 4500, 4321]}) df_agg = df.groupby('Country').agg(['min', 'mean', 'max']) print(df_agg) 对分组后的部分列进行聚合

8.1K30

从Excel到Python:最常用的36个Pandas函数

在开始使用Python进行数据导入前需要先导入numpypandas库 import numpy as np import pandas as pd 导入外部数据 df=pd.DataFrame(pd.read_csv...主要包括数据表的合并,排序,数值分列,数据分组及标记等工作。 1.数据表合并 在Excel中没有直接完成数据表合并的功能,可以通过VLOOKUP函数分步实现。...4.数据分组 Excel中可以通过VLOOKUP函数进行近似匹配来完成对数值的分组,或者使用“数据透视表”来完成分组 Python中使用Where函数用来对数据进行判断分组 #如果price列的值>3000...5.数据分列 Excel中的数据目录下提供“分列”功能。 ?...3.标签位置提取(ix) ix是lociloc的混合,既能索引标签提取,也能位置进行数 据提取.

11.3K31

python df 列替换_如何用Python做数据分析,没有比这篇文章更详细的了(图文详情)...

1import numpy as np  2import pandas as pd  导入数据表  下面分别是从 excel csv 格式文件导入数据并创建数据表的方法。...感兴趣的朋友可以参考 pandas 的  官方文档。  ...生成数据表的函数是 pandas 库中的 DateFrame 函数,数据表一共有 6 行数据,每行有 6 个字段。在数据中我们特意设置了一些 NA 值有问题的字段,例如包含空格等。...1#索引列排序  2df_inner.sort_index()  sort_index  数据分组  Excel 中可以通过 VLOOKUP 函数进行近似匹配来完成对数值的分组,或者使用“数据透视表”...']=1  sign  数据分列  与数据分组相反的是对数值进行分列,Excel 中的数据目录下提供“分列”功能。

4.4K00

懂Excel就能轻松入门Python数据分析包pandas(七):分列

后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 前言 今天从两个需求来看看数据分列功能,由于 Excel 自带功能比较弱,在处理稍微复杂的需求时会显得力不从心...本文结构: - 先看看简单的分列 - 接着尝试分割扩展成行 - 最后是多列分割扩展成行 Excel 分列 Excel 中对数据进行分列是非常简单的。...pandas 分列 pandas 对文本列进行分列,非常简单: - DataFrame.str.split() ,对文本列分列,第一参数指定分隔符 - 此外,参数 expand ,表示是否扩展成列...",选"分隔符" - 这里大部分设置与 Excel 自带功能基本一致 - 点开"高级选项",点选"拆分为"中的"行" - 功能区"开始",最左边点按钮"关闭并上载",即可把结果输出会 Excel...如下: - 同时把科目成绩分割扩展到行 直接看 pandas 怎么解决: - 先对 科目 与 成绩 列分别进行 split 后,再进行 explode - 然后通过 concat,与原来的 性名

2.5K30

懂Excel就能轻松入门Python数据分析包pandas(七):分列

后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 前言 今天从两个需求来看看数据分列功能,由于 Excel 自带功能比较弱,在处理稍微复杂的需求时会显得力不从心...本文结构: - 先看看简单的分列 - 接着尝试分割扩展成行 - 最后是多列分割扩展成行 Excel 分列 Excel 中对数据进行分列是非常简单的。...pandas 分列 pandas 对文本列进行分列,非常简单: - DataFrame.str.split() ,对文本列分列,第一参数指定分隔符 - 此外,参数 expand ,表示是否扩展成列...",选"分隔符" - 这里大部分设置与 Excel 自带功能基本一致 - 点开"高级选项",点选"拆分为"中的"行" - 功能区"开始",最左边点按钮"关闭并上载",即可把结果输出会 Excel...如下: - 同时把科目成绩分割扩展到行 直接看 pandas 怎么解决: - 先对 科目 与 成绩 列分别进行 split 后,再进行 explode - 然后通过 concat,与原来的 性名

1.3K10

DataFrameSeries的使用

DataFrameSeries是Pandas最基本的两种数据结构 可以把DataFrame看作由Series对象组成的字典,其中key是列名,值是Series SeriesPython...与Python常用数据类型对照 加载筛选数据 df根据列名加载部分列数据:加载一列数据,通过df['列名']方式获取,加载多列数据,通过df[['列名1','列名2',...]]。...df行加载部分数据:先打印前5行数据 观察第一列 print(df.head()) 最左边一列是行号,也就是DataFrame的行索引 Pandas默认使用行号作为行索引。...分组聚合运算 先将数据分组 对每组的数据再去进行统计计算如,求平均,求每组数据条目数(频数)等 再将每一组计算的结果合并起来 可以使用DataFrame的groupby方法完成分组/聚合计算 df.groupby...(by='year')[['lifeExp','pop','gdpPercap']].mean() # 根据year分组,查看每年的life平均值,pop平均值gpd平均值,用mean做聚合运算 也可以根据两个列分组

7810

Pandas的apply, map, transform介绍性能测试

虽然apply的灵活性使其成为一个简单的选择,但本文介绍了其他Pandas函数作为潜在的替代方案。 在这篇文章中,我们将通过一些示例讨论apply、agg、maptransform的预期用途。...来看看一个简单的聚合——计算每个组在得分列上的平均值。  ...结果类似于额外的栈操作。我们这里尝试重现它。我们将使用我们的原始数据框并添加一个城市列。假设我们的三个学生 John、James Jennifer 都来自波士顿。  ...在subject 列上分组,我们得到了我们预期的多索引。  ...df_single_group.groupby("subject").apply(lambda x: x["score"]) 但当我们city列分组时,只有一个组(对应于“波士顿”),我们得到:

1.9K30

一道简单的电商数据分析笔试题:求组合商品的库存量

不过,本文我们也会提供两种方式才进行处理,分别是pythonexcel数据合并计算。 2....2.1. python计算过程 核心:pandas的mergetransform函数方法 import pandas as pd # 读取数据 df = pd.read_excel(r'案例数据.xlsx...所以,这里我们需要对组合商品字段进行简单的数据分列拆分(可以参考此前推文《一看就会的Pandas文本数据处理》)。...首先想到的可能是分组或透视的形式,当然这里用到的是transform,大家可以用别的试试哈。...先去掉空行 然后将组合商品字段填充 =IF(B3="",A2,B3) 接着对组合商品表中组成商品分列(按照)* 再用vlookup获取每个组成商品的的库存量 计算对组合商品而言实际库存(除以单组成商品数量

88010

Pandas数据分组的函数应用(df.apply()、df.agg()df.transform()、df.applymap())

文章目录 apply()函数 介绍 样例 性能比较 apply() 数据聚合agg() 数据转换transform() applymap() 将自己定义的或其他库的函数应用于Pandas对象,有以下...3种方法: apply():逐行或逐列应用该函数 agg()transform():聚合转换 applymap():逐元素应用函数 apply()函数 介绍 apply函数是pandas里面所有函数中自由度最高的函数...score_music amax 96 92 min 59 70 3)使用字典可以对特定列应用特定及多个函数; 例:对数学成绩求均值最小值...dtype: object 从上述例子可以看出,applymap()操作实际上是对每列的Series对象进行了map()操作 通过以上分析我们可以看到,apply、agg、transform三种方法都可以对分组数据进行函数操作...,但也各有特色,总结如下: apply中自定义函数对每个分组数据单独进行处理,再将结果合并;整个DataFrame的函数输出可以是标量、Series或DataFrame;每个apply语句只能传入一个函数

2.2K10

Pandas Cookbook》第07章 分组聚合、过滤、转换1. 定义聚合2. 用多个列函数进行分组聚合3. 分组后去除多级索引4. 自定义聚合函数5. 用 *args **kwargs

用多个列函数进行分组聚合 # 导入数据 In[9]: flights = pd.read_csv('data/flights.csv') flights.head() Out[9]...# 用列表嵌套字典对多列分组聚合 # 对于每条航线,找到总航班数,取消的数量比例,飞行时间的平均时间方差 In[12]: group_cols = ['ORG_AIR', 'DEST_AIR'...# 'AIRLINE', 'WEEKDAY'分组,分别对DISTARR_DELAY聚合 In[14]: airline_info = flights.groupby(['AIRLINE', 'WEEKDAY...更多 # Pandas默认会在分组运算后,将所有分组的列放在索引中,as_index设为False可以避免这么做。...weighted_math = df['UGDS'] * df['SATMTMID'] return int(weighted_math.sum() / df['UGDS'].sum()) # 分组

8.8K20

超全的pandas数据分析常用函数总结:下篇

文章中的所有代码都会有讲解注释,绝大部分也都会配有运行结果,酱紫的话,整篇总结篇幅量自然不小,所以我分成了上下两篇,这里是下篇。 《超全的pandas数据分析常用函数总结:上篇》 5....5.6 切割数据 对date字段的值依次进行分列,并创建数据表,索引值为data的索引列,列名称为year\month\day。...数据提取 下面这部分会比较绕: loc函数标签值进行提取,iloc位置进行提取pandas.DataFrame.loc() 允许输入的值: 单个标签,例如5或’a’,(请注意,5被解释为索引的标签,...6.2.6 用iloc取不连续的多行多列 提取第3行第6行,第4列第5列的交叉值 data.iloc[[2,6],[3,5]] 输出结果: ?...8.3 以两个属性进行分组计数 data.groupby(["department","origin"]).count() 输出结果: ?

4.9K20

超全的pandas数据分析常用函数总结:下篇

文章中的所有代码都会有讲解注释,绝大部分也都会配有运行结果,酱紫的话,整篇总结篇幅量自然不小,所以我分成了上下两篇,这里是下篇。 《超全的pandas数据分析常用函数总结:上篇》 5....5.6 切割数据 对date字段的值依次进行分列,并创建数据表,索引值为data的索引列,列名称为year\month\day。...数据提取 下面这部分会比较绕: loc函数标签值进行提取,iloc位置进行提取pandas.DataFrame.loc() 允许输入的值: 单个标签,例如5或’a’,(请注意,5被解释为索引的标签,...6.2.6 用iloc取不连续的多行多列 提取第3行第6行,第4列第5列的交叉值 data.iloc[[2,6],[3,5]] 输出结果: ?...8.3 以两个属性进行分组计数 data.groupby(["department","origin"]).count() 输出结果: ?

3.9K20
领券