Pandas mutliIndex sort by组_Groupby和sort Pandas_Pandas sort_values中的KeyError - 腾讯云开发者社区

python、pandas

我正在Pandas中生成很多相关数据。它们都有相同的形状和格式。所以这是数据A:- free_memory memory_in_use active_memory free_memory 1 0.190912742 0.375301656 memory_in_use 0.190912742 1 0.962653384 active_memory 0.375301656 0.962653384 1 这是dataframe

浏览 13提问于2016-02-19得票数 1

回答已采纳

1回答

在分组DataFrame中使用两个参数的python熊猫滚动函数

python、pandas

这在某种程度上是对我以前的问题的扩展。如何按组执行相同的操作？假设下面的'C‘列用于分组。我正在努力：按列分组'C‘ 在每一组中，按“A”排序对于每个组，对参数'A‘和'B’应用一个滚动函数，其中包含两个参数，如kendallτ。预期的结果将是如下所示的DataFrame：正如上面的链接所描述的那样，我一直在尝试“传递索引”的解决方法，但是这种情况的复杂性超出了我的能力:-(。这是一个玩具例子，离我的工作不远，所以为了简单起见，我使用了随机生成的数据。 rand = np.random.RandomState(1) df

浏览 2提问于2017-01-18得票数 2

回答已采纳

1回答

datetime.date在Pandas0.8.1中用set_index、groupby和应用程序创建了许多问题

python、pandas、datetime、pandas-groupby

我使用Pandas0.8.1在一个由于官僚主义原因无法升级的环境中。在阅读所有关于初始问题和我的目标之前，您可能想跳到下面的“简化问题”部分。我的目标:将DataFrame按分类列"D“分组，然后对每个组按日期列”dt“排序，将索引设置为"dt"，执行滚动OLS回归，并返回按日期索引的回归系数的DataFrame beta。最终的结果希望是一堆堆叠的beta帧，每个都是特定类别变量所特有的，因此最终的索引将是两个级别，一个用于类别ID，另一个用于日期。如果我做了这样的事 my_dataframe.groupby("D").apply(some_w

浏览 0提问于2013-10-25得票数 0

回答已采纳

5回答

Python Pandas:使用groupby()和agg()时是否保持顺序？

python、pandas、aggregate

我经常使用pandas的agg()函数对data.frame的每一列运行汇总统计信息。例如，下面是生成平均值和标准差的方法： df = pd.DataFrame({'A': ['group1', 'group1', 'group2', 'group2', 'group3', 'group3'], 'B': [10, 12, 10, 25, 10, 12], 'C': [100,

浏览 399提问于2014-10-20得票数 59

回答已采纳

3回答

idxmax()在包含SeriesGroupBy的NaN上不起作用

python、pandas

这是我的密码 from pandas import DataFrame, Series import pandas as pd import numpy as np income = DataFrame({'name': ['Adam', 'Bill', 'Chris', 'Dave', 'Edison', 'Frank'], 'age': [22, 24, 31, 45, 51, 55],

浏览 2提问于2015-07-29得票数 1

回答已采纳

2回答

Pandas:与以前的值不同

python、pandas

给定一个如下所示的Pandas数据帧 GROUP VALUE MASK 1 5 false 2 10 false 2 20 false 1 7 true 3 17 false 3 18 false 1 100 false 1 200 true 对于掩码为真的每一行，我希望获得该组中前一个值的差值，即结果应为 VALUE DIFF 7 2 200 100 我如何在Pandas中

浏览 2提问于2016-10-22得票数 7

1回答

为什么大熊猫成群的速度不同？

performance、pandas、group-by

为什么在pandas中，从32m行数据帧中获取组的这三种方法的性能存在差异。 df = df.groupby(["a", "b", "c"]).groups df = df.groupby(["a", "b", "c"]).count() df = df.index df = df.groupby(["a", "b", "c"]).count() df = df.drop(df.columns, axis=1).reset_index() 最后一种

浏览 0提问于2016-07-18得票数 0

1回答

Pandas -查找具有多索引级别之一的最小值的行

python、pandas、dataframe

因此，我有一个具有多个索引的DataFrame，如下所示： info1 info2 info3 abc-8182 2012-05-08 10:00:00 1 6.0 "yeah!" 2012-05-08 10:01:00 2 25.0 ":(" pli-9230 2012-05-08 11:00:00 1 30.0 "see yah!" 2012-05-08 11

浏览 0提问于2013-04-03得票数 0

回答已采纳

1回答

关于如何调整代码以将正确的表作为数据帧返回，有什么建议吗？

python、pandas、dataframe

我正在尝试编写一个函数，该函数接受数据帧，按列对数据帧进行分组，然后使用第二列的平均值从最大到最小对该列进行排序。我正在尝试返回一个数据帧。我同时使用了seaborn和pandas。这就是我到目前为止所知道的 def table(df, columnone, columntwo): dfnew = df.groupby([columnone])[columntwo].nlargest() return dfnew 我不太确定我错过了什么，或者我应该寻找什么。我是python的新手，如果有任何帮助，我将不胜感激。

浏览 1提问于2021-04-21得票数 0

1回答

如何根据日期将多索引df分割成80/20部分？

python、pandas、scikit-learn

在我的df中，我有这样一个多索引： df.index.names FrozenList([u'Ticker', u'Date']) <class 'pandas.core.frame.DataFrame'> MultiIndex: 189667 entries, (AAPL, 1992-08-31 00:00:00) to (^DJI, 2017-08-31 00:00:00) 在一个索引df上，我会这样做： from sklearn.model_selection import train_test_split df_train,

浏览 0提问于2017-10-22得票数 1

回答已采纳

2回答

基于另一列的pandas中类别的缺失值的补偿

python、pandas、fillna

如何在pandas数据帧中填充NaN值？我的数据是这样的 id state zone xxx AP south xxx AP xxx AP xxx AP xxx delhi north xxx delhi xxx delhi xxx delhi xxx delhi 基于已知zone只属于state的AP列，如何在south列中填充缺失的值，如何使用pandas来填充值？

浏览 4提问于2020-01-21得票数 0

1回答

将csv列/行从1, 1，1,2，2，2，3,3,3到1，2，3,1，2，3，3，2，2，3，3，3重新排序

python、pandas、sorting、iterator、series

我需要重新排序一个csv文件，该文件通过从0到184000的id列对数据进行分组。不幸的是它的0,0,0,0,0,1,1,1,1,1,2,2,2,2,2,3,3,3,3,3等等..。我需要1, 2, 3, 1, 2, 3, 1, 2, 3等等。 0, 1, 2, 3等的第一个实例，制作第一个系列，第二个实例，0, 1, 2, 3，下一个等等。有人建议使用Python和Pandas，但我想不出这一点。我可以读取csv，列出列和行的数据，但是找不到根据我的需求对其进行排序的方法。我一直在看pandas.Series，但我觉得我的术语搞错了. 那么两件事，它是什么叫我想做的事情，谁知道我可以

浏览 1提问于2020-11-15得票数 1

回答已采纳

2回答

pandas中的Groupwise排序

python、pandas、sorting、pandas-groupby

我想对另一个数组中定义的组边界内的数组进行排序。组不会以任何方式预先排序，并且在排序后需要保持不变。在numpy术语中，它看起来如下所示： import numpy as np def groupwise_sort(group_idx, a, reverse=False): sortidx = np.lexsort((-a if reverse else a, group_idx)) # Reverse sorting back to into grouped order, but preserving groupwise sorting revidx = np.ar

浏览 2提问于2018-04-23得票数 6

2回答

由一组熊猫产生的列表的顺序

python、pandas

我有一个关于的问题考虑一下 df.groupby('col1')['col2'].apply(list) 订单上有什么保证吗？例如，以下内容表明它是这样做的： In [1]: import pandas as pd In [2]: df = pd.DataFrame({"col1": ['a', 'a', 'b', 'b', 'b'], "col2": [1,2,3,4,5]}) In [3]: df.groupby('col1'

浏览 0提问于2018-01-30得票数 3

1回答

给定和对multiIndex数据进行排序

python、pandas、multi-index

你好，我在Pandas中准备了一个MultiIndex表，如下所示： Lang C++ java python All Corp Name ASW ASW 0.0 7.0 8.0 15 Cristiano NaN NaN 8.0 8 Michael NaN 7.0 0 7 Facebook Facebook 8.0 1.0 5.0 14

浏览 4提问于2022-08-11得票数 1

回答已采纳

1回答

熊猫: sort=False时数据群的最终定单

python、pandas、dataframe、pandas-groupby

根据上的Pandas文档排序: bool，默认True 对组键排序。通过关闭这个来获得更好的性能。注意，这并不影响每一组中观察的顺序。Groupby保留每个组中行的顺序。这并不能真正描述当sort=False时，组的顺序是否是随机的，或者在groupby之前保留原来的顺序。对火星的行为有什么见解吗？

浏览 5提问于2022-04-06得票数 2

2回答

熊猫-如何获得名单

python、pandas、pandas-groupby

(我正在学习熊猫，所以请解释解决方案) 我的数据如下： Category currency sellerRating Duration endDay ClosePrice 0 Music/Movie/Game US 3249 5 Mon 0.01 0.01 1 Music/Movie/Game US 3249 5 Mon 0.01 0.01 2 Music/Movie/Game US 3249 5 Mon 0.01 0.01 3

浏览 0提问于2017-10-11得票数 0

回答已采纳

2回答

如何在dask.DataFrame中获取组的第一项？

python、dataframe、dask、dask-dataframe

我希望获得包含ID的列的每组不同条目的第一项。它适用于熊猫，但不适用于dask，因为我不能对多个列进行排序，而且.head聚合也没有实现。还有别的方法可以得到想要的结果吗？这里是熊猫的模拟例子，在那里一切都很好。 import pandas as pd t=pd.DataFrame([[1,2,"ij"],[1,2,"huHU"],[2,4],[2,9],[0,17],[0,2],[1,8],[1,-18]],columns=["particleID","distZ","someothercols"]) tz

浏览 13提问于2022-11-12得票数 0

1回答

基于多列排序的秩

python、pandas、numpy、sorting、rank

我试图按ID_1进行分组，按ID_2降序和TotalRevenue排序以提取一个级别。请协助使用等级排序函数中的升序和降序功能。 import pandas as pd df = pd.DataFrame({ 'ID_1':[1,1,1,2,2,2,3,3], 'ID_2':[100,100,35,30,30,20,50,50], 'TotalRevenue':[9000,2000,750,1000,600,500,500,300]}) df['RANK']= df.groupby(['

浏览 2提问于2020-07-04得票数 1

回答已采纳

1回答

按组计算正数率

python、pandas、dataframe、pandas-groupby

我正在使用具有以下结构的Pandas DataFrame： import pandas as pd df = pd.DataFrame({'brand' : ['A', 'A', 'B', 'B', 'C', 'C'], 'target' : [0, 1, 0, 1, 0, 1], 'freq' : [5600, 220, 5700, 90, 5000, 100]})

浏览 1提问于2020-04-08得票数 1

回答已采纳

1回答

如何在熊猫中添加“团体内的订单”栏？

python、pandas

以下列数据为例： import pandas as pd df = pd.DataFrame({'group_name': ['A','A','A','B','B','B'], 'timestamp': [4,6,1000,5,8,100], 'condition': [True,True,False,True,False,True]}) 我想增加两栏：该行在其组内的顺序

浏览 4提问于2015-06-09得票数 5

回答已采纳

1回答

Jupyter笔记本中有错误，但Mac终端或Visual Studio代码中没有错误

python、pandas、dataframe、jupyter-notebook

我有以下代码，应该这样做:获取人口普查数据，清理它(只保留县-使用SUMLEV==50列，只保留需要的列)，设置州列作为索引，按县人口对州进行排序，仅显示每个州的人口前3个县，添加这3个县的人口，返回为列出前3个人口最多的县的3个人口最多的州。该代码在Mac终端和VSC中运行良好，但在Coursera的Jupyter笔记本中抛出错误。我试着重启内核，同样的事情。知道为什么吗？谢谢。 import pandas as pd census_df = pd.read_csv('census.csv') census_df.head() def answer_six():

浏览 20提问于2020-06-09得票数 0

回答已采纳

2回答

Python3.4熊猫分类市场-按日期分列的数据

python-3.x、sorting、pandas

我正在尝试设置Python (3.4)代码，以便按日期对时间序列进行排序。在python shell中，我输入以下内容 >>>data = quandl.get("YAHOO/INDEX_GSPC", start_date="2017-01-01", end_date="2017-01-20") >>>print(data) 所以，我可以加载数据。但是，当我尝试使用排序命令时 >>>data = data.sort_values(by='Date') 我得到以下错误消息列表。

浏览 0提问于2017-03-31得票数 2

2回答

我在读取这个csv文件并将第一列命名为"team“时遇到了问题。

python、python-3.x、csv

由于某些原因，我无法将csv文件正确读取到代码中。下面是我的代码： df_playoffs = pd.read_csv('/Users/hannahbeegle/Desktop/playoff_teams.csv', encoding='latin-1', index_col = 'team') df_playoffs.fillna('None', inplace=True) 以下是错误消息： Warning (from warnings module): File "/Library/Frameworks/Pyt

浏览 0提问于2019-07-18得票数 1

1回答

熊猫assert_frame_equal误差

python、pandas

我正在构建测试用例，我想比较两个数据格式。尽管dataframe具有相同的列和值，但assert_frame_equal报告并不相等。列顺序不同，我尝试重新排序列，但没有成功。在我的测试用例中，我使用以下函数： testing.assert_frame_equal(expected, tested, check_dtype=False) 第一个dataframe声明如下： df2 = pandas.DataFrame({ 'artista': [u'Beyoncé', 'Radiolab', 'Xmas', &#

浏览 1提问于2017-03-29得票数 5

回答已采纳

3回答

枚举DataFrame中每个组的每一行

python、pandas

在pandas中，如何添加基于给定分组枚举行的新列？例如，假设DataFrame如下： import pandas as pd import numpy as np a_list = ['A', 'B', 'C', 'A', 'A', 'C', 'B', 'B', 'A', 'C'] df = pd.DataFrame({'col_a': a_list, 'col_b': range(10)}) df

浏览 1提问于2013-06-21得票数 16

回答已采纳

2回答

如何在一个pandas dataframe行中添加具有相同id的所有元素？

python、python-3.x、pandas

我有下面的pandas数据帧，我希望在不丢失id和fruit列的时间顺序的情况下，将元素序列转换为单个列。 id fruit ---|------ 101 apple 102 apple 101 watermelon 101 orange 102 orange 104 lemon 105 lemon 104 lemon 105 apple 103 grapes 例如，新的数据帧应如下所示的(*) id col 101 apple, watermelon, orange 102 apple, orange 103 grapes 104

浏览 40提问于2018-06-03得票数 1

回答已采纳

1回答

Pandas:聚合后每组的计数器列

python、pandas

这里是pandas和dataframes的新手！初始数据帧： A 1238 100 A 1238 90 A 3784 200 A 3784 500 B 1222 274 B 1222 400 C 2747 800 C 1384 100 我需要这样的输出：(C列是A列和B列的分组数据的最小值，B列是分组数据的顺序计数器)： A 1 90 A 2 200 B 1 274 C 1 800 C 2 100 帮助!

浏览 2提问于2020-01-24得票数 2

3回答

群迭代排序

python、pandas、dataframe

下面是代码和控制台输出。 import pandas as pd #data df= pd.DataFrame([{'col1':'a', 'is_open':0}, {'col1':'b', 'is_open':1}]) #1 df = df.sort_values('is_open',ascending=False).reset_index(drop=True) # print(df) #2 for i, d in df.groupby(['col1', &

浏览 19提问于2022-06-23得票数 0

回答已采纳

2回答

从groupby 2列后的第3列获取对应值

python、pandas、group-by

下面的代码对每个类别的“time”最大值进行分组。我想在'target‘变量中获得相应的值，但我不确定如何做到这一点。有什么提示吗？ import numpy as np import pandas as pd data=[[1,1,2,2,'A'], [2,5,5,1,'A'], [3,7,9,4,'B'], [1,5,1,9,'B'], [1,8,2,8,'C'], [2,8,5,10,'C'], [0,1,2,3

浏览 0提问于2021-07-24得票数 5

1回答

如果标题不存在，熊猫将行为空白。

excel、python-3.x、pandas

我正在尝试将多个excel文件与Python结合起来。有些文件有不同的标题：这就是它失败的地方： # Turn them into dataframes using pandas frames = [] for excel in excels: frame = excel.parse(excel.sheet_names[0],index_col=None) frames.append(frame[['Charges', 'Amount','Taxes','Date','Discount Percent'

浏览 3提问于2019-12-12得票数 0

回答已采纳

1回答

熊猫sort_values在不应用类别参数时使用的排序算法

python、sorting、pandas、dataframe

在Pandas的sort_values方法中，只有在对单个列或标签进行排序时才应用kind参数。为什么会这样，在没有应用kind参数的情况下使用什么排序算法？是一种稳定的类型吗？ (有关文档，请参见。)

浏览 3提问于2017-05-26得票数 3

1回答

如何对Pandas数据进行条件排序(即根据另一列中的值在一列内进行升序和降序)？

python、pandas、dataframe、sorting

是否可以对Pandas的多列行进行排序，并将列中的一些行按升序排列，而其他行(在同一列中)按降序排列？下面是我正在寻找的一个可复制的小例子：设置 import pandas as pd df = pd.DataFrame(data={'class':['A','A','A','B','B','B','C','C','C'], 'val':[20,10,15,55, 75

浏览 11提问于2022-03-16得票数 4

1回答

按组指数获取组

pandas、group-by、python-3.8

我想按组索引访问组。我的数据如下所示 import pandas as pd from io import StringIO import numpy as np data = """ id,name 100,A 100,B 100,C 100,D 100,pp; 212,E 212,F 212,ds 212,G 212, dsds 212, sas 300,Endüstrisi` """ df = pd.read_csv(StringIO(data)) 我想按'id‘进行分组，并通过其组索引访问组。 dfg=df.groupby(&#

浏览 0提问于2021-02-26得票数 0

回答已采纳

1回答

熊猫“to_csv”中的“DataFrameGroupBy”对象的问题)

python、pandas、export-to-csv

我想输出一个Pandas组的数据到CSV。尝试了各种StackOverflow解决方案，但它们都没有起作用。 Python 3.7 这是我的密码 groups = clustering_df.groupby(clustering_df['Family Number']) groups.apply(lambda clustering_df: clustering_df.sort_values(by=['Family Number'])) groups.to_csv('grouped.csv') 错误消息 (AttributeError:无法访问“

浏览 2提问于2019-12-04得票数 0

1回答

如何重采样，包括前一个重放集的最后一个值？

python、pandas

我需要根据不同的时间分辨率计算不同的业绩指标，例如每年或每月。一种理想的方法是使用Pandas的重采样，但我也需要一种方法将前一个重采样集的最后一个值传递到下一个，即由于内部重采样集返回计算。显然，执行resample('M')不支持这一点。 import pandas as pd import numpy as np df = pd.DataFrame(np.arange(1, 61), index=pd.date_range('2021-12-31', '2022-02-28'), columns=['price']) pr

浏览 4提问于2022-01-18得票数 1

回答已采纳

1回答

Pandas:基于其他列的特定增量的索引派生列

python、python-3.x、pandas、sorting

我有以下数据框： import pandas as pd pandas_df = pd.DataFrame([ ["SEX", "Male"], ["SEX", "Female"], ["EXACT_AGE", None], ["Country", "Afghanistan"], ["Country", "Albania"]], columns=['FullName', 'ResponseLa

浏览 24提问于2020-11-29得票数 1

3回答

熊猫Dataframe groupby语句输出到2列

python、pandas

我有一本价值字典： {'Spanish Omlette': -0.20000000000000284, 'Crumbed Chicken Salad': -1.2999999999999972, 'Chocolate Bomb': 0.0, 'Seed Nut Muesli': -3.8999999999999915, 'Fruit': -1.2999999999999972, 'Frikerdels Salad': -1.2000000000000028, 'Seed Nut

浏览 10提问于2017-03-21得票数 2

回答已采纳

1回答

用Python和Pandas处理矩阵

python、pandas、matrix

我在一个以制表符分隔的文件中有一个每两列都有链接数据的文件(在本例中只有3列，但也可以更多)： Names SampleA Names SampleB Names SamplesC Name1 5 Name3 7 Name1 8 Name2 9 Name2 1 Name2 2 Name4 4 Name4 8 Name3 8 NameX

浏览 26提问于2019-06-04得票数 0

1回答

对pandas groupby操作应用排序

python、pandas

如何对pandas groupby操作应用排序？下面的命令返回一个错误，指出'bool‘对象不可调用 import pandas as pd df.groupby('cokey').sort('A') cokey A B 11168155 18 56 11168155 0 18 11168155 56 96 11168156 96 152 11168156 0 96

浏览 1提问于2015-04-07得票数 14

回答已采纳

2回答

Pandas Groupby取值范围

python、group-by、pandas

pandas中有没有一种简单的方法来调用一系列递增的值来调用groupby？例如，在给定以下示例的情况下，能否以0.155增量对列B进行入库和分组，使得例如，列B中的前几个组被划分为介于'0 - 0.155，0.155 -0.31...`之间的范围 import numpy as np import pandas as pd df=pd.DataFrame({'A':np.random.random(20),'B':np.random.random(20)}) A B 0 0.383493 0.250785 1 0.57

浏览 1提问于2014-01-30得票数 108

回答已采纳

2回答

在Pandas/Numpy中用用户定义的函数最有效地使用groupby应用

python、pandas、numpy

我缺少关于在Pandas或Numpy中使用群应用设置中使用用户定义函数的最有效(阅读:最快)方法的信息。我已经做了一些我自己的测试，但我想知道是否有其他的方法，我还没有遇到。以以下示例DataFrame为例： import numpy as np import pandas as pd idx = pd.MultiIndex.from_product([range(0, 100000), ["a", "b", "c"]], names = ["time", "group"]) df = pd.DataFrame

浏览 0提问于2020-12-27得票数 2

1回答

群体累积标准差

pandas

如何计算不同长度群的累积标准差？ import pandas as pd df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'foo', 'foo', 'bar', 'foo', 'foo'], 'B': ['one', 'one', 'two'

浏览 0提问于2019-01-27得票数 1

回答已采纳

2回答

预排序DataFrame上熊猫群的迭代排序

python、pandas、group-by、pandas-groupby

形势我使用基于特定列中的值的特定分类器对DataFrame中的行进行分类。我的目标是根据特定条件将结果附加到一个或另一个新列。目前的代码如下所示： df = pd.DataFrame({'A': [list with classifier ids], # Only 3 ids, One word strings 'B': [List of text to be classified], # Millions of unique rows, lines of text around 5-25 words long

浏览 9提问于2017-11-08得票数 5

回答已采纳

1回答

选择数据框中某列的前X%，使其受制于另一列

python、pandas、dataframe

考虑一个pandas数据帧： df = DataFrame(data = {"col1": [9,8,7,6,5,4,3,2,1], "col2": ["A","A","C","A","C","B","C","B","A"]}) >>> df col1 col2 0 9 A 1 8 A 2 7 C 3 6 A 4 5

浏览 14提问于2021-04-16得票数 2

回答已采纳

1回答

熊猫用字符串和整数按列对数据进行排序

python、sorting、pandas

我有一个包含整数和字符串的列的dataframe： >>> df = pd.DataFrame({'a':[2,'c',1,10], 'b':[5,4,0,6]}) >>> df a b 0 2 5 1 c 4 2 1 0 3 10 6 我希望按a列对数据进行排序，将字符串和整数分开处理，首先使用字符串： >>> df a b 1 c 4 2 1 0 0 2 5 3 10 6 ...but不允许将整数与字符串进行比较。 TypeE

浏览 0提问于2016-10-13得票数 0

回答已采纳

3回答

如何确保由Pandas为count创建的列有一个名称？

python、pandas

这肯定是一个基本的问题，但很难发现。假设我使用了Pandas groupby和agg方法来按某一列进行计数： df.groupby(['col1']).agg(['count']) 那么，假设我想根据结果计数进行排序： df.groupby(['col1']).agg(['count']).sort_values('count') 这给了我一个错误： KeyError：“计数” 因此，结果的计数列实际上不是一个列，或者是一个没有键的列。如果是这样的话，我将如何在计数中对结果数据进行排序？

浏览 0提问于2018-04-20得票数 0

2回答

我能用“从future导入”来克服熊猫中“排序”的API变化吗？

python、pandas、sorting

排序函数上的熊猫API已经从版本17上改变了，所以现在您需要使用df.sort_values而不是df.sort。出于某些原因，我需要在不同版本的机器上运行相同的代码。是否有一种方法可以用“排序”或"sort_values“处理两个熊猫版本，使用from __future__ import语句来修改下面的代码？ import pandas as pd df = pd.DataFrame([1,7,5], columns=["A"]) print df df=df.sort_values("A") # from pandas versio

浏览 4提问于2017-09-22得票数 0

回答已采纳

5回答

使用linux命令对第二列排序

awk、sed、grep

是否有可能对文本进行横向排序？例如，我有这个Hun拼写文件，它有所有的英语单词，后面跟着标签。(它可能包含unicode文本和数百万字) test/BACac this/QPR line/MNP again/Xx 我需要对标签进行排序(最好是:先用小写字母，然后是大写字母)： test/acABC this/PQR line/MNP again/xX 我可以在熊猫身上这样做。但是我想知道我是否可以只用linux命令完成任务！ import pandas as pd df = pd.read_csv('test.csv', sep='/', header=None

浏览 4提问于2021-05-29得票数 1

回答已采纳

4回答

转置和连接字符串

python、python-3.x、pandas

如何在不使用for循环的情况下转置和连接pandas数据帧？以下是输入数据： input_data = pandas.DataFrame({'a': ['fruit', 'fruit', 'fruit', 'food', 'food', 'food', 'food'], 'b': ['banana', '', 'apple', 'rice'

浏览 39提问于2019-05-29得票数 3

回答已采纳