开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

pandas df.loc保持原始df的顺序

pandas 是一个用于数据处理和分析的 Python 库，其中的 DataFrame 是一个二维表格型的数据结构，可以存储多种类型的数据。df.loc 是 DataFrame 的一个属性，用于基于标签的索引，它允许你选择特定的行和列。

基础概念

df.loc 是一种索引器，用于访问 DataFrame 中的数据。它使用行和列的标签来定位数据，而不是使用整数位置。这意味着你可以使用行和列的名字来选择数据。

保持原始 `df` 的顺序

当你使用 df.loc 来选择数据时，它会保持原始 DataFrame 的顺序。这是因为 loc 是基于标签的索引，而不是基于位置的索引。即使你在选择数据时没有按照原始的行顺序来指定标签，loc 也会返回一个与原始 DataFrame 行顺序相同的结果。

示例代码

import pandas as pd

# 创建一个示例 DataFrame
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
}
df = pd.DataFrame(data)

# 使用 df.loc 选择数据
selected_data = df.loc[:, ['B', 'A', 'C']]

print("原始 DataFrame:")
print(df)
print("\n使用 df.loc 选择后的 DataFrame:")
print(selected_data)

输出

原始 DataFrame:
   A  B  C
0  1  4  7
1  2  5  8
2  3  6  9

使用 df.loc 选择后的 DataFrame:
   B  A  C
0  4  1  7
1  5  2  8
2  6  3  9

应用场景

当你需要根据列名来选择数据时。
当你需要保持数据的原始顺序时。
当你需要对数据进行条件筛选时。

可能遇到的问题及解决方法

问题： 使用 df.loc 后数据顺序发生了改变。

原因： 这通常是因为在选择数据时，列的顺序被改变了，而不是因为 loc 本身改变了数据的顺序。

解决方法： 确保在使用 df.loc 选择数据时，列的顺序与你期望的顺序一致。

# 正确的列顺序
selected_data_correct_order = df.loc[:, ['A', 'B', 'C']]

通过这种方式，你可以确保即使在选择数据时改变了列的顺序，最终的结果仍然会保持原始 DataFrame 的行顺序。

相关搜索:Pandas - df.loc -只能比较相同标签的系列基于条件使用df.loc时的Pandas UserWarning Pandas df.loc比较-浮动-条件从不工作对df.loc ==语句使用append() Pandas Python 保持分类变量的原始顺序 Pandas Dataframe :为什么df.loc[df[ 'height'] >3，‘height’]=2和df.loc[df['height']>3，[‘height’]=2之间存在差异在pandas中使用df.loc应用try/except 具有多条件和检索值的Pandas df.loc索引 Pandas列到Dict保持顺序创建保持原始顺序的Mono Array对象使用'select variables‘命令保持原始变量顺序如何合并Pandas DF并保持合并的结构？从df.loc[]获取新的DF并选择唯一值更新Rails中的所有记录时保持原始顺序保持原始列顺序的DevExpress Winforms XtraGrid解组列 joblib.Parallel是否保持传递数据的原始顺序？等同于df.loc()的np.where()合并data.tables，同时保持R中的原始顺序 bash、awk、sed删除具有重复ID的XML块，保持最新，保持原始顺序在使用python pandas pivot时保持顺序

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

pandas中 df和df]的不同

样例数据 df = pd.DataFrame({‘X’: [1, 2, 7, 5, 10], ‘Y’: [4, 3, 8, 2, 9]}) df[‘X’] [[]] df[[‘X’]]...相信通过观察它们的输出结果，你一定可以会猜测他们的数据类型不同的。...df[‘X’]更像是pd.series类型的，而df[[“X”]]是pd.Dateframe类型，事实也的确如此。...type(df[‘X’]) type(df[[‘X’]]) 除此之外，df[[‘X’,‘Y’]]这样的写法也是被支持的，而df[‘X’,‘Y’]则不被允许。...df[[‘X’,‘Y’]]

1.7K2 0

Pandas数据分组的函数应用（df.apply()、df.agg()和df.transform()、df.applymap()）

文章目录 apply()函数介绍样例性能比较 apply() 数据聚合agg() 数据转换transform() applymap() 将自己定义的或其他库的函数应用于Pandas对象，有以下...(df['score_math'].apply(np.mean)) pandas.core.series.Series'> #逐行求每个学生的平均分 >>> df.apply(np.mean...(np.mean,axis=1)) pandas.core.series.Series'> apply()的返回结果与所用的函数是相关的：返回结果是Series对象：如上述例子应用的均值函数...()的特例，可以对pandas对象进行逐行或逐列的处理；能使用agg()的地方，基本上都可以使用apply()代替。...DataFrame大小不同的DataFrame，返回结果中：在列索引上第一级别是原始列名在第二级别上是转换的函数名 >>> df.transform([lambda x:x-x.mean(),lambda

2.3K1 0

Pandas图鉴(三)：DataFrames

但它是一种特殊的复制，允许作为一个整体进行赋值： df.loc['a']=10工作（单行可作为一个整体写入）。 df.loc['a']['A']=10起作用（元素访问传播到原始df）。...最后一种情况，该值将只在切片的副本上设置，而不会反映在原始df中（将相应地显示一个警告）。根据情况的背景，有不同的解决方案：你想改变原始数据框架df。...警告为了摆脱这种情况下的警告，让它成为一个真正的副本： df1 = df.loc['a':'b'].copy(); df1['A']=10 Pandas还支持一种方便的NumPy语法，用于布尔索引...从这个简化的案例中你可以看到（见上面的 "full outer join 全外链"），与关系型数据库相比，Pandas在保持行的顺序方面是相当灵活的。...同时保持了左边DataFrame的索引值和行的顺序不变。

4442 0

【数据处理包Pandas】DataFrame数据的基本操作

一、DataFrame数据的查询首先，导入 NumPy 和 Pandas 库。...print(type(df.loc[['乙'],['英语']])) pandas.core.frame.DataFrame'> 二、DataFrame数据的编辑（一）增加数据 1、一次增加一列数据...del 关键字直接在原始 DataFrame 上操作，不返回新的 DataFrame，而是直接修改原始对象。 del 关键字只能用于删除列，不能用于删除行。...ascending：排序顺序，默认为升序，设置为False则为降序。...df1 = df.sort_values("英语") print(df1) print(df) 排序后df的记录顺序保持不变，因为inplace参数默认为False。

920 0

在 Pandas DataFrame 中应用 IF 条件的5种方法

本文介绍 Pandas DataFrame 中应用 IF 条件的5种不同方法。...创建该 IF 条件的通用代码结构如下： df.loc[df['column name'] condition, 'new column name'] = 'value if condition is met...使用lambada表达式实现案例3的代码如下： import pandas as pd names = {'First_name': ['Jon','Bill','Maria','Emma']} df...= 'Emma'), 'name_match'] = 'Mismatch' print (df) 查询结果如下：在原始DataFrame列上应用 IF 条件上面的案例中，我们学习了如何在新增列中应用...IF 条件，有时你可能会遇到将结果存储到原始DataFrame列中的需求。

9.4K3 0

Pandas和Numpy的视图和拷贝

这张图和前面的图对比一下，似乎也只是下标的顺序不同罢了。是不是感觉有点复杂？...使用单个的下表，比如df.loc[mask, 'z'] = 0，这样不仅意义明确，而且简单可行。当然，对于上面问题的理解，就涉及到下面要说的视图（浅拷贝）和拷贝（深拷贝）问题了。...当你有一个很大的原始数组，但只需要其中的一小部分时，你可以在切片后调用' .copy() '，并用' del '语句删除指向原始数组的变量。通过这种方式，您保留了副本，并从内存中删除了原始数组。...注意：如果原始数组很大，但是你只需要其中的一小部分时，可以先用切片得到一个小数组，然后它的.copy()，并用del删除引用原始数组的变量。...8 27 0 e 16 81 64 有的时候Pandas可能不会针对拷贝报错，比如： >>> df = pd.DataFrame(data=data, index=index) >>> df.loc

3.1K2 0

Pandas中Apply函数加速百倍的技巧

前言虽然目前dask,cudf等包的出现，使得我们的数据处理大大得到了加速，但是并不是每个人都有比较好的gpu，非常多的朋友仍然还在使用pandas工具包，但有时候真的很无奈，pandas的许多问题我们都需要使用...实验对比 01 Apply(Baseline) 我们以Apply为例，原始的Apply函数处理下面这个问题，需要18.4s的时间。...%%time df['new'] = df['c'] * df['d'] #default case e = =10 mask = df['e'] < 10 df.loc[mask,'new'] = df...[mask,'new'] = df['c'] + df['d'] mask = df['e'].values < 5 df.loc[mask,'new'] = df['a'] + df['b'] CPU...，具体的： Apply: 18.4 s Apply + Swifter: 7.67 s Pandas vectorizatoin: 421 ms Pandas vectorization + data

6266 0

Pandas图鉴(四)：MultiIndex

Python 只允许在方括号内使用冒号，不允许在小括号内使用，所以你不能写df.loc[(:, 'Oregon'), :]。警告! 这里不是一个有效的Pandas语法!...在level转换为CategoricalIndex后，在sort_index、stack、unstack、pivot、pivot_table等操作中保持原来的顺序。...可以像下面这样简单地更新通过外部MultiIndex level引用的列的子集：或者如果想保持原始数据的完整性 df1 = df.assign(population=df.population*10...一种方法是将所有不相关的列索引层层叠加到行索引中，进行必要的计算，然后再将它们解叠回来（使用pdi.lock来保持原来的列顺序）。...或者，你也可以使用pdi.assign： pdi.assign有锁定顺序的意识，所以如果你给它提供一个锁定level的DataFrame这不会解锁它们，这样后续的stack/unstack等操作将保持原来的列和行的顺序

6212 0

Pandas切片操作：一个很容易忽视的错误

Pandas切片 Pandas数据访问方式包括：df[] ,.at,.iat,.loc,.iloc（之前有ix方法，pandas1.0之后已被移除） df[] ：直接索引 at/iat：通过标签或行号获取某个数值的具体位置...Try using .loc[row_indexer,col_indexer] = value instead 根据提示信息，我们使用loc方法 df.loc[df['x']>3,'y']=50...这里我们就遇到了所谓的“链接索引”，具体原因是使用了两个索引器，例如：df[][] df[df['x']>3] 导致Pandas创建原始DataFrame的单独副本 df[df['x']>3]['y']...反转切片的顺序时，即先调用列，然后再调用我们要满足的条件，便得到了预期的结果： df['y'][df['x']>3]=50 x y w 0 1 0.1 11 1 5 50.0...4 0.4 14 5 5 30.0 15 当我们创建了视图后，pandas就会出现warning，因为它不知道我们是否只想更改y系列（通过z）或原始值df。

2.4K2 0

Python可视化数据分析08、Pandas_Excel文件读写

Python可视化数据分析08、Pandas_Excel文件读写前言博客：【红目香薰的博客_CSDN博客-计算机理论,2022年蓝桥杯,MySQL领域博主】 ✍本文由在下【红目香薰】原创，...openpyxl：openpyxl源于PHPExcel，它提供了针对.xlsx文件的读写功能 xlsxwriter：用来将内容写入到.xlsx文件中 xlrd：用来读取.xls和.xlsx文件中的数据...安装顺序 pip3 install openpyxl pip3 install xlsxwriter pip3 install xlrd Excel写入 import pandas as pd...(2)) # 查看name到age列 print(df.loc[:, "name":"age"]) # 基本统计 print("最大年龄：", df.age.max()) print("平均年龄："..."], index=["id", "sex", "name", "age", "introduce"]) df.loc[3] = value print(df) # 条数 print(len(df))

6741 0

pandas的引用与复制

之前一直以为pandas任何的切片和筛选都是引用，也就是说，会改变最原始的数据。但是前几天发现并不是这样的。 ...下面对最常见的几种pandas 数据截取的方式做一个整理。...999 print '2', df df = df_gen() d1 = df.loc[1,:] d1[0] = 999 print '3', df df = df_gen() d1 = df['a']...= df_gen() d1 = df[df.a > 1] d1[0] = 999 print '2', df df = df_gen() d1 = df.loc[df.a > 1, 'b'] d1[0...refernce的时候，df原始的值被改变了，说明d1只是一个引用，而后面的copy则不然。在使用pandas的时候要注意这一特性。

2.2K2 0

Pandas爬取历史天气数据

Series 和 DataFrame 是Pandas 中最主要的数据结构，使用Pandas 就是使用 Series 和 DataFrame 来构造原始数据。...['主天气状况'] = df.loc[:, '天气状况'].apply(lambda x: ptianqi.findall(x)[0]) 92 df['次天气状况'] = df.loc[:, '...主风力'] = df.loc[:, '主风力'].apply(lambda x: clean_fengli(x)) 96 df['次风向'] = df.loc[:, '风力风向'].apply(...(x)[1][1]) 98 df['次风力'] = df.loc[:, '次风力'].apply(lambda x: clean_fengli(x)) 99 df['最高温度'] = df.loc...，单边的则将风力调低 0.5 级，整数的则原始值。

2.4K4 0

Pandas 2.2 中文官方教程和指南（十七）

如上所述，在读取原始数据时处理重复项是一个重要的功能。也就是说，您可能希望避免在数据处理管道中引入重复项（从方法如pandas.concat()、rename()等）。...分类数据的所有值都在categories或np.nan中。顺序由categories的顺序而不是值的词法顺序定义。...要获得类型为 category 的单个值 Series，您需要传入一个包含单个值的列表： In [156]: df.loc[["h"], "cats"] Out[156]: h x Name:...要获取类型为category的单个值Series，您需要传入一个包含单个值的列表： In [156]: df.loc[["h"], "cats"] Out[156]: h x Name: cats...要获得类型为category的单一值Series，您可以传入一个只有一个值的列表： In [156]: df.loc[["h"], "cats"] Out[156]: h x Name: cats

4681 0

如何保持json序列化的顺序性？

是谁来决定的呢？如何保持？说到底，json是框架还是啥？实际上它只是一个数据格式，一个规范标准，它永远不会限制实现方的任何操作，即不会自行去保证什么顺序性之类的。...json本身是不可能保持有序了，所以，当我们自行写入json数据时，只需要按照 abcde... 这种key顺序写入数据，那么得到的最终json就是有序的。...保持json有序的应用场景举例为什么要保持json有序呢？json相当于kv数据，一般情况下我们是不需要保证有序的，但有些特殊情况下也许有用。...以上测试中，除了最后一个array的位置调换，导致的结果不一样之外，总体还是相等的。纠其原因，是因为原始数据结构是一致的，而fastjson从一定程度上维持了这个有序性。...比如，ArrayList 的顺序性被维护，map的顺序性被维护。但是很明显，这些顺序性是根据数据结构的特性而定的，而非所谓的字典序，那么，如果我们想维护一个保持字典序的json如何处理呢？

4K3 0

DataFrame和Series的使用

pd.DataFrame(data={'职业':['AI工程师','AI架构师'],'年龄':[28,36]},columns=['职业','年龄'],index=['Tome','Bob']) # 原始行索引为...df按行加载部分数据：先打印前5行数据观察第一列 print(df.head()) 最左边一列是行号，也就是DataFrame的行索引 Pandas默认使用行号作为行索引。...loc方法传入行索引，来获取DataFrame的部分数据（一行，或多行） df.loc[0] df.loc[99] df.loc[last_row_index] iloc : 通过行号获取行数据 iloc...传入的是索引的序号，loc是索引的标签使用iloc时可以传入-1来获取最后一行数据，使用loc的时候不行 loc和iloc属性既可以用于获取列数据，也可以用于获取行数据 df.loc[[行]，[列]...] df.iloc[[行]，[列]] df.loc[:,['country','year','pop']] # 获取全部的行，但每一行的列内容接受三个 df.iloc[:,[0,2,4,-1]] df.loc

1091 0

Python中 Pandas 50题冲关

Pandas 是基于 NumPy 的一种数据处理工具，该工具为了解决数据分析任务而创建。Pandas 纳入了大量库和一些标准的数据模型，提供了高效地操作大型数据集所需的函数和方法。...Python中的Numpy基础20问参考资料 | 100-pandas-puzzles - GitHub | Pandas 百题大冲关基本操作导入 Pandas 库并简写为 pd，并输出版本号 import...) 展示df的前3行 df.iloc[:3] # 方法二 #df.head(3) 取出df的animal和age列 df.loc[:, ['animal', 'age']] # 方法二 # df[[...']>4)] # 方法二 # df[df['age'].between(2, 4)] f行的age改为1.5 df.loc['f', 'age'] = 1.5 计算visits的总和 df['visits...（A, B, C每一个的和） s.sum(level=0) #方法二 #s.unstack().sum(axis=0) 交换索引等级，新的Series是字典顺序吗？

4.2K3 0

Pandas 50题练习

受到numpy100题的启发，我们制作了pandas50题。 Pandas 是基于 NumPy 的一种数据处理工具，该工具为了解决数据分析任务而创建。...摩拳擦掌想做题试试手感的参考资料 | 100-pandas-puzzles - GitHub | Pandas 百题大冲关基本操作导入 Pandas 库并简写为 pd，并输出版本号 import...) 展示df的前3行 df.iloc[:3] # 方法二 #df.head(3) 取出df的animal和age列 df.loc[:, ['animal', 'age']] # 方法二 # df[[...']>4)] # 方法二 # df[df['age'].between(2, 4)] f行的age改为1.5 df.loc['f', 'age'] = 1.5 计算visits的总和 df['visits...（A, B, C每一个的和） s.sum(level=0) #方法二 #s.unstack().sum(axis=0) 交换索引等级，新的Series是字典顺序吗？

3K2 0

盘点一个Python自动化办公实战案例（四）

最好是把你想要的结果展示在excel中，另外，你展示的这个表格最好做个小的demo发上来，不要让大佬们再手动创建原始数据。实在不行，你就自己录制视频，或者发语音在群里提问都可以。...代码如下： import pandas as pd df = pd.read_excel("替换.xlsx") ionp = df[df.编号.str.startswith("IONP")] rule...代码如下： import pandas as pd df = pd.read_excel('替换.xlsx') # 1、找到【入库】和【出库】都包合一工厂、二工厂、三工厂半成品的记录 compile..., ['物料代码', '入库']] # 2、根据上一查找结果的物料代码，找到当前需要替换的入库信息等于IONP出库信息的记录 ionp = df.loc[(df['物料代码'] + df['出库'])....【小小明】：那看来merge已经没有优化空间了，参考你的拼合法，又写了一下： import pandas as pd df = pd.read_excel("替换.xlsx") ionp = df.loc

1571 0

pandas数据清洗，排序，索引设置，数据选取

此教程适合有pandas基础的童鞋来看，很多知识点会一笔带过，不做详细解释 Pandas数据格式 Series DataFrame：每个column就是一个Series 基础属性shape,index...#min 值相等时，取排名最小值 #max 值相等时，取排名最大值 #first值相等时，按原始数据出现顺序排名 ---- 索引设置 reindex() 更新index或者columns，默认...([1,2,3]) df['A'].isin([1,2,3]) df.loc[df['A'].isin([5.8,5.1])]选取列A中值为5.8，5.1的所有行组成dataframe query...= 0 df.loc[df['sepal_length'] > 6, 'test'] = 1 df.loc[df['sepal_length'] <=6, 'test'] = 0 # 需求2：创建一个新变量...['test2'] = 0 df.loc[(df['petal_length']>2)&(df['petal_width']>0.3), 'test2'] = 1 df.loc[(df['sepal_length

3.3K2 0

pandas每天一题-题目1、2、3

这是一个关于 pandas 从基础到进阶的练习题系列，来源于 github 上的 guipsamora/pandas_exercises 。这个项目从基础到进阶，可以检验你有多么了解 pandas。...A：df.head(10) B：df.iloc[:10] C：df.iloc[:11] D：df.loc[range(0,10)] 接下来就是答案了！...D：df.loc 可以获取指定行索引值得到记录。刚好本题加载数据时没有指定行索引，因此默认的行索引的值与位置索引一致。因此本答案有效。但是这是取巧的做法，如果行索引改变，那么此写法将导致错误结果。...---- 答案：B、C、D B：df 本质上是通过 numpy 数组保存数据，为了与 numpy 尽可能保持用法一致，因此 pandas 为 df 设置了 shape 属性，能获取二维长度，他是一个元组...---- 答案：B、D、E B：df 本质上是通过 numpy 数组保存数据，为了与 numpy 尽可能保持用法一致，因此 pandas 为 df 设置了 shape 属性，能获取二维长度，他是一个元组

4222 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭