对pandas数据帧中的某些列进行重新排序_使用可变列对Pandas数据帧进行排序_对Pandas数据帧中的某些值进行平均？ - 腾讯云开发者社区

python、pandas

浏览 17提问于2020-08-31得票数 2

2回答

如何在一个pandas dataframe行中添加具有相同id的所有元素？

python、python-3.x、pandas

我有下面的pandas数据帧，我希望在不丢失id和fruit列的时间顺序的情况下，将元素序列转换为单个列。 id fruit ---|------ 101 apple 102 apple 101 watermelon 101 orange 102 orange 104 lemon 105 lemon 104 lemon 105 apple 103 grapes 例如，新的数据帧应如下所示的(*) id col 101 apple, watermelon, orange 102 apple, orange 103 grapes 104

浏览 40提问于2018-06-03得票数 1

回答已采纳

7回答

是否同时对列和索引值对pandas数据帧进行排序？

python、pandas、sorting、dataframe

按列的值和索引对pandas dataframe进行排序是否可行？如果按列的值对pandas数据帧进行排序，则可以得到按列排序的结果数据帧，但不幸的是，您会看到数据帧的索引顺序与排序列的值相同。那么，我是否可以按列对数据帧进行排序，例如名为count的列，但也可以按索引值对其进行排序？按降序对列进行排序也是可行的，但是按升序对索引进行排序是否可行呢？我知道如何对dataframe中的多个列进行排序，也知道通过首先对索引执行reset_index()并对其进行排序，然后再次创建索引，就可以实现这里所要求的结果。但是，这是不是更直观、更有效的方法呢？

浏览 2提问于2013-11-29得票数 59

1回答

大熊猫CSV

python、pandas、dask

上一篇文章的续篇。以前，我帮助使用Pandas在dataframe中创建了一个新列，每个值都表示一个基于另一个列的值的分解后的或唯一的值。我在一个测试用例上使用了它，它成功地工作了，但我在处理更大的日志和htm文件时遇到了问题，无法对其执行相同的过程。我有12个日志文件(每个月)，在合并它们之后，我得到一个17 get的文件来处理。我想要分解它上的每个用户名。我一直在研究使用Dask，然而，我不能复制sort和factorize的功能来为Dask数据帧做我想要的事情。是尝试使用Dask，继续使用Pandas，还是尝试使用MySQL数据库来操作17 or的文件？ import pandas as

浏览 0提问于2017-06-13得票数 1

4回答

如何按行对数据帧进行排序？

python、pandas、dataframe

我有一个数据框架： import pandas as pd df = pd.DataFrame(data={'x':[7,1,9], 'y':[4,5,6],'z':[1,8,3]}, index=['a', 'b', 'c']) 它显示：如何按行‘a’对此数据帧进行排序:对数据帧进行排序后，可能是：

浏览 0提问于2016-08-14得票数 1

1回答

Python对一列进行分组，并从多个行中详细列出另一列中的最小和最大字母值

python、pandas、pandas-groupby

我是一个使用Python的新手，从使用SQL开始，我一直使用PANDAS从CSV文件构建报告，并取得了相当的成功。多亏了这个网站，我能够回答大多数问题，但我似乎无法找到问题的答案：我有一个数据帧，它有两列，我希望能够在第一列上分组，并显示连接到第三列的第二列中的最低和最高字母值。在SQL中我可以很容易地做到这一点，但正如我所说的，我很难在Python/Pandas中理解它示例：源数据： LINK_NAME，CITY_NAME 林卡，Citya 林卡，城市 Linkb，Cityx Linkb，城市所需输出： LINK_NAME，LINKID 林卡，CityaCityz Linkb，Cit

浏览 3提问于2020-02-02得票数 0

1回答

Dask是否保证分区内的行(具有非唯一索引)永远不会被重新排序？

python、pandas、dask

我的应用程序需要将数据集读入到dask中，该数据集分布在多个分区中。使用该数据帧，我需要对其执行多个操作(例如，从一列中减去另一列或求出两列的比率)。dataframe的索引是一个非唯一列。因为应用程序完全是元数据驱动的，函数调用的顺序直到运行时才知道，所以我将应用程序设计为在每个阶段都依赖于返回一个新的延迟数据帧。我想知道一些分区和按列连接的巧妙使用是否可以帮助我提高代码的效率。考虑到这些步骤是相互独立的，在下面的具体示例中，我可以相信最后一个操作会给出我的逐行比率的正确结果吗？也就是说，如果我执行的操作只向dataframe添加新的列，我可以相信行的顺序永远不会改变吗？ def su

浏览 21提问于2019-06-08得票数 0

回答已采纳

1回答

Python Pandas -对分组绘图条形图进行排序

python、pandas、matplotlib、seaborn

我有一个Pandas DataFrame，我groupby一个列，调用.size，然后调用.plot.bar 我想按原始数据帧中的一些列重新排序条形图，但是在bar()的sort_columns中传递它们是不起作用的： nodes.groupby("Name").size().plot.bar(sort_columns="Class") 对数据框中的列进行预排序也没有任何效果--如何对Pandas条形图中的列进行排序？

浏览 1提问于2015-12-03得票数 0

2回答

基于另一列的pandas中类别的缺失值的补偿

python、pandas、fillna

如何在pandas数据帧中填充NaN值？我的数据是这样的 id state zone xxx AP south xxx AP xxx AP xxx AP xxx delhi north xxx delhi xxx delhi xxx delhi xxx delhi 基于已知zone只属于state的AP列，如何在south列中填充缺失的值，如何使用pandas来填充值？

浏览 4提问于2020-01-21得票数 0

2回答

在pandas中，我可以同时映射和插入列到特定的索引吗？

python、pandas、dataframe、insert

在pandas中，是否可以同时将新列映射并插入到dataframe中的特定索引/位置？我可以(从多键字典)获得映射，并在数据帧的末尾成功创建一个新列。 #using multi_key_dict https://pypi.python.org/pypi/multi_key_dict from multi_key_dict import multi_key_dict k = multi_key_dict() k['AAAA', 'BBBB'] = 'San Francisco' k['CCCC'] = 'Los Angel

浏览 0提问于2016-06-17得票数 2

1回答

numpy可以对字典对象列表进行排序吗?或者pandas数据帧操作是唯一的选择吗？

python、pandas、numpy

我正在使用一个公共API来获取数据。我需要按特定列对响应对象(字典项列表)进行排序。我可以在pandas数据帧中做到这一点，但如果可能的话，我想用numpy来提高速度。这个是可能的吗？

浏览 12提问于2021-09-06得票数 0

回答已采纳

2回答

Spark -如何在列的基础上以最小的混洗重新划分数据帧？

apache-spark、apache-spark-sql

我们有多个数据帧。其中一个数据帧是主数据帧，它使用左-外连接与其他数据帧连接。所有这些数据帧都连接在4列上(比如col1、col2、col3、col4)。为了减少数据混洗，目前我们正在对4个连接列上的所有数据帧进行重新分区，然后连接这些数据帧(从左到外)。有没有更好的方法来连接/重新划分这些数据帧，以便最大限度地减少数据混洗？谢谢

浏览 2提问于2019-02-08得票数 2

1回答

关于如何调整代码以将正确的表作为数据帧返回，有什么建议吗？

python、pandas、dataframe

我正在尝试编写一个函数，该函数接受数据帧，按列对数据帧进行分组，然后使用第二列的平均值从最大到最小对该列进行排序。我正在尝试返回一个数据帧。我同时使用了seaborn和pandas。这就是我到目前为止所知道的 def table(df, columnone, columntwo): dfnew = df.groupby([columnone])[columntwo].nlargest() return dfnew 我不太确定我错过了什么，或者我应该寻找什么。我是python的新手，如果有任何帮助，我将不胜感激。

浏览 1提问于2021-04-21得票数 0

2回答

多个pandas列

python、pandas

如果有包含4列的pandas数据帧，如下所示： A B C D 0 2 4 1 9 1 3 2 9 7 2 1 6 9 2 3 8 6 5 4 是否可以以某种方式应用df.cumsum()来在现有列旁边的新列中获得结果，如下所示： A AA B BB C CC D DD 0 2 2 4

浏览 0提问于2018-01-20得票数 1

2回答

Spark Dataframes:如何更改Java/Scala中列的顺序？

java、scala、dataframe、spark-dataframe

在连接两个数据帧之后，我发现列的顺序改变了我的预期。例如:在b上连接具有列[b,c,d,e]和[a,b]的两个数据帧将产生[b,a,c,d,e]的列顺序。如何更改列的顺序(例如，[a,b,c,d,e])？我已经找到了在Python/R中做到这一点的方法，但没有找到Scala或Java。是否有任何方法允许交换或重新排序数据帧列？

浏览 1提问于2016-06-29得票数 4

1回答

pandas:具有保留列顺序的to_csv追加模式

pandas

我正在使用： df.to_csv('file.csv', header=False, mode='a') 将多个pandas数据帧逐个写入CSV文件。我确保这些数据帧具有相同的列名集。但是，似乎列顺序将以随机顺序写入，因此我有一个chaos CSV文件。如何确保新的数据帧将按照以前数据的列顺序写入？非常感谢

浏览 21提问于2018-08-02得票数 0

1回答

为什么pandas.to_gbq函数不考虑我的表模式中的列顺序？

python、pandas、dataframe、google-bigquery

我想使用Dataframe.to_gbq()函数将熊猫数据帧上传到Big Query。我指定了一个table_schema参数来强制BigQuery中的特定列顺序(这可能不同于Dataframe)。所以我举个例子： table_schema = [{'name': 'col1', 'type': 'INT64'}, {'name': 'col2', 'type': 'STRING'}, {'name': 'col3',

浏览 19提问于2021-07-12得票数 0

2回答

附加两个DataFrames列和排序列(前两个除外)

python、pandas、simplify

我想连接由两个列表创建的两个数据帧： import pandas as pd import numpy as np header_1 = ['A', 'B', -1, 3, 5, 7] data_1 = ['X', 'Y', 1, 2, 3, 4] d = pd.DataFrame(np.array([data_1]), columns=header_1) header_2 = ['A', 'B', -2, 4, 5, 6] data_2 = ['X', 'Z',

浏览 0提问于2016-11-10得票数 1

回答已采纳

2回答

Python pandas dataframe sort_values不起作用

python、pandas

我有下面的pandas数据帧，我想按'test_type‘排序 test_type tps mtt mem cpu 90th 0 sso_1000 205.263559 4139.031090 24.175933 34.817701 4897.4766 1 sso_1500 201.127133 5740.741266 24.599400 34.634209 6864.9820 2 sso_2000 203.204082 6610.437558 24.466267 34.83

浏览 1提问于2016-09-20得票数 0

回答已采纳

1回答

pandas to sql -保留从pandas内存到postgres的行的顺序

python、pandas、postgresql

经过大量处理后，我在内存中有了一个pandas数据帧。在此过程之后，我根据1列对数据帧进行排序。但是，当我将此数据帧写入Postgres表时，有时行的顺序不会保留，就像它在pandas内存中一样。我怎么才能修复它呢？代码片段： result_df = result_df.sort_values(by=['D1RowNr']) result_df.to_sql(table_name,engine, schema = schema, if_exists='replace', index= False,

浏览 0提问于2020-12-22得票数 0

2回答

字典中有分类ip地址的方法吗？

python、pandas、ip-address

我正在使用Pandas对数据帧进行排序。少数列是需要排序的IP地址。有没有一种方法可以方便地根据IP地址对Pandas进行排序？我可以用Pandas创建一个自定义函数来对IP地址进行排序吗？我能够对IP地址列表进行排序，但是我很难弄清楚如何使用Pandas创建自定义排序函数。有没有一种从套接字模块中合并inet_aton的方法？在Pandas之外的列表中，我完成了这个任务： list_of_ips = ['192.168.204.111', '10.10.10.10', '172.16.32.6', '1.1.1.1', &

浏览 4提问于2019-07-12得票数 3

回答已采纳

2回答

在Python中将2列的数据帧转换为一系列2列

python、pandas

我正在尝试处理一些时间序列数据，并且对pandas dataframe还是个新手。我有一个包含两列的数据帧，如下所示： +---+-----------------------+-------+--+ | | 0 | 1 | | +---+-----------------------+-------+--+ | 1 | 2018-08-02 23:00:00 | 456.8 | | | 2 | 2018-08-02 23:01:00 | 457.9 | | +---+-----------------------+------

浏览 0提问于2018-08-16得票数 0

2回答

使用pandas对数据帧进行排序。保持列的完整性

python、pandas、sorting、dataframe

如下图所示，我想按字母顺序按Type对聊天进行排序。但是，我不希望打乱每个Chat name中[Date , User_id]的顺序。在输入数据帧位于左侧的情况下，我该如何操作？(在python中使用Pandas )

浏览 1提问于2018-10-24得票数 2

1回答

逐行打印数据帧中的每一行日期或数据，并将其传递给函数

function、datetime、pandas

我有一个数据帧，它包含一些开始和结束日期，我想逐行传递给函数，即成对的开始和结束日期。 Data start | end 2015-06-01 2016-06-28 . . . 我希望能够将数据帧的整行或某些列从数据帧传递给函数，并且该函数分别对所有行进行重复。我只能让pandas中的.apply和.applymap处理数据帧中的单个列，而不能处理数据帧中的多个或所有列(或者只是传递给函数的列数)。

浏览 1提问于2016-06-04得票数 1

1回答

在潘达斯，合并怎么这么快？即使我还没有按索引排序呢？

performance、pandas、merge

我正在合并熊猫中的两个数据集，并希望加快这个过程，所以我在用于合并的列中对这两个数据集进行了排序。(以前，这些列根本没有排序。)排序没有造成明显的速度差异，两者都花了大约8秒。如果我手动合并两堆纸，比如说，它们的页码，我会首先按页码对它们进行排序。否则，我将不得不做很多来回翻转之间的堆栈。我写了一个测试来比较这两个过程。它按随机顺序生成两个帧，每个帧有一百万行。然后，它将生成第一列上已排序的另外两个列。然后，它合并前两个，最后，合并后两个。数据生成过程太慢了，以至于我没有时间尝试更多的行--但是合并仍然是在零感知的时间内进行的，即使没有排序。 import pandas as pd im

浏览 0提问于2018-03-20得票数 6

1回答

KeyError：“[索引([‘星期一’，‘星期二’，‘星期三’，‘星期四’，‘星期五’，‘星期六’，‘星期日’]，dtype=‘object’]都不在[索引]中。”

python、pandas、error-handling、keyerror

我有一个熊猫数据帧，看起来像这样： weekday mean sum Friday 160 26572 Monday 150 73762 Saturday 55 67256 Sunday 626 22222 Thursday 133 34566 weekday是索引，mean和sum是列。我现在尝试做的是使用以下代码绘制数据帧并对条形图进行正确排序： df2['sum'].value_counts()[['Monday', 'Tuesday', 'Wednesday',

浏览 40提问于2021-05-11得票数 0

回答已采纳

5回答

从数据帧中删除反向重复项

python、pandas、dataframe

我有一个包含两列的数据框，A和B。在这种情况下，A和B的顺序并不重要；例如，我认为(0,50)和(50,0)是重复的。在pandas中，从数据帧中删除这些重复项的有效方法是什么？ import pandas as pd # Initial data frame. data = pd.DataFrame({'A': [0, 10, 11, 21, 22, 35, 5, 50], 'B': [50, 22, 35, 5, 10, 11, 21, 0]}) data A B 0 0 50 1 10

浏览 63提问于2016-11-08得票数 14

回答已采纳

2回答

pandas数据透视表-更改非索引列的顺序

python、pandas

我使用以下命令创建了一个数据透视表： table2 = pandas.pivot_table(df, index=['Salesperson'], values=['Gross Sales', 'Gross Profit'], aggfunc=numpy.sum) table2['Profit Margin'] = table2['Gross Profit'] / table2['Gross Sales'] table2_rounded = table2.round({'Gross Prof

浏览 2提问于2016-04-01得票数 8

回答已采纳

2回答

索引到Dask系列可以返回Dask系列

python、pandas、dask

我有Dask系列的Dask数据帧。我想在本系列中建立索引，以获取dask数据帧以供后续工作使用。但是，使用loc[0]会导致另一个dask系列。使用to_frame也不起作用，因为结果是"Dask系列Dask数据帧的Dask数据帧“。下面是一个使用Dask系列Pandas数据帧的最小示例(不完全相同，但说明了问题)： import pandas as pd import dask.dataframe as dd pdf1 = pd.DataFrame({'a': [1,2,3,4], 'b': [4,3,2,1]}) pdf2 = pd.Data

浏览 3提问于2020-02-03得票数 1

2回答

使用R中另一个data.frame中的两列对一个data.frame进行重新排序

我在R中有两个data.frames，其中一个有两列，另一个有三列，并且两个框架之间有两个公共列。帧具有相同的行数。下面提供了帧A和b的示例。我需要做的是使用a中行的顺序重新排序b中的行。请注意，在第b帧中，前两列的任何唯一组合id和lob都将与val列中的唯一值相关联。这里给出的id和lob列是一个因子和一个字符，但是我想要一个适用于任何数据类型的解决方案。请注意，如果我们考虑这样一种情况，即框架a只有id列，而框架b只有id和val列，我将使用以下内容来完成此操作 b[match(a$id,b$id),] 不幸的是，当我需要按两列排序时，我不确定如何完成相同的事情。答： id lo

浏览 0提问于2010-08-24得票数 1

回答已采纳

3回答

Pandas - Groupby数据帧存储为数据帧而不聚合

python、pandas、group-by

我是Pandas的新手，我在这里读了很多文档，帖子和答案，但我一直无法辨别出一个好的策略来实现我的目标，抱歉，如果它已经回答了，我找不到它。这就是我所拥有的： df = {'key': ['A', 'B', 'A', 'B'], 'value': [2,2,1,1]} df = pd.DataFrame(df) df key value 0 A 2 1 B 2 2 A 1 3 B 1 我知道执行groupby()会返回一个groupby对象，而且我知道我可以使

浏览 0提问于2016-03-18得票数 1

2回答

将新列插入到数据帧中会给出'ValueError:值的长度(4)与索引的长度(6)不匹配‘

python、python-3.x、pandas、data-science

我用pandas库创建了一个数据帧。我想向dataframe中添加一列。然而，我得到了以下error.But，我想我必须输入与lines.How数量一样多的数据，我可以在我想要的行和列中输入信息吗？如果不输入数据，如何创建列？ import pandas as pd kd = pd.DataFrame(data) insertColumns = kd.insert(0, "Age", [21, 23, 24, 21],True ) print(kd) 错误： ValueError: Length of values (4) does not match length o

浏览 302提问于2020-10-10得票数 2

回答已采纳

1回答

对大熊猫中的一列进行排序就是返回相同的未排序信息。

python、pandas、sorting

我使用pandas_datareader来提取雅虎股票数据并计算百分比变化。现在，我想将这些百分比的更改值从最低到最高排序，并将排序后的数据放入新的列中。列正在生成，但值没有排序，只是复制。 import pandas_datareader as pdr Ticker = 'SQ' result = pdr.get_data_yahoo(Ticker) result = result.drop(['Open','High','Low','Volume','Adj Close'], axis=1)

浏览 2提问于2017-08-05得票数 1

回答已采纳

1回答

对R中的数据帧排序

通过各种Coursera项目，我已经看到，如果不验证排序依据的列是否转换为数字形式，则可能会错误地对数据帧进行排序。例如，当我对一列数字(分类为字符向量)进行排序时，R按升序排列: 18.9、19.1、9.8、9.9。我想知道是否有订购的最佳实践？如果我不是在多项选择测试中这样做，我可能永远不会注意到错误的顺序。专业人士在排序时是否总是确保列是数字的？

浏览 1提问于2017-05-03得票数 0

3回答

根据布尔向量合并两个pandas数据帧

python、pandas

我的问题如下：假设我在pandas中有两个具有相同列数的数据帧，例如： A= 1 2 3 4 8 9 和 B= 7 8 4 0 并且还有一个长度正好是来自A的行数num +B行数=5的布尔向量，具有与B中的行数相同的1数，这在本例中意味着两个1。假设是Bool= 0 1 0 1 0。然后，我的目标是将A和B合并到一个更大的名为C的数据帧中，这样B的行将对应于Bool中的1，所以在这个例子中，它将给出： C= 1 2 7 8 3 4 4 0 8 9 你知道怎么做吗？如果你知道这对我有多大的帮助。感谢您的阅读。

浏览 0提问于2017-05-24得票数 10

2回答

使用DataFrame ()独立地对熊猫DataFrame的所有列进行排序

python、pandas

我有一个dataframe，并希望按降序或升序对所有列进行独立排序。 import pandas as pd data = {'a': [5, 2, 3, 6], 'b': [7, 9, 1, 4], 'c': [1, 5, 4, 2]} df = pd.DataFrame.from_dict(data) a b c 0 5 7 1 1 2 9 5 2 3 1 4 3 6 4 2 当我为此使用时，它不像预期的那样工作(对我来说)，只对一列进行排序： foo = df.sort_v

浏览 9提问于2017-04-07得票数 5

回答已采纳

2回答

删除跨列的反转对(Pandas)

python-3.x、pandas

我有一个Pandas数据帧，看起来像这样： Group1 Group2 Sim A A 1.0 A B 0.5 A C 0.8 B B 1.0 B A 0.5 B C 0.7 C C 1.0 C A 0.8 C B 0.7 Group1和Group2列表示两个组对，Sim列表示Jaccard相似性

浏览 30提问于2020-07-09得票数 4

回答已采纳

1回答

将python脚本转换为Spotfire Python数据函数的问题

python、spotfire

我有一个非常简单的脚本，它有两个步骤：按A列和B列对数据帧进行排序，创建一个新的列(D)，该列(D)是通过在C列中用相同的值标记顺序行来生成的，并在每次行值变化时将标签增加1，从而对类似数据的所有顺序组进行标记。我的Python脚本在下面，运行得很好，我不想把它作为Python数据函数引入到Spotfire中，并且在将它连接到输入和输出参数方面有问题。原始python脚本 import pandas as pd import numpy as np df.sort_values(['ColumnA', 'ColumnB'], ascending=[True

浏览 1提问于2021-03-25得票数 0

回答已采纳

3回答

按绝对值排序而不更改数据

python、pandas、sorting、dataframe

我正在寻找一种简单的方法来根据特定列的绝对值对pandas数据帧进行排序，而不需要实际更改数据帧中的值。类似于sorted(df, key=abs)的东西。因此，如果我有一个数据帧，比如： a b 0 1 -3 1 2 5 2 3 -1 3 4 2 4 5 -9 按'b‘排序时，得到的排序数据如下所示： a b 2 3 -1 3 4 2 0 1 -3 1 2 5 4 5 -9

浏览 0提问于2015-05-27得票数 53

回答已采纳

3回答

我应该用每个函数重新定义一个pandas数据帧吗？

python、pandas、dataframe

根据经验，一些pandas函数需要我重新定义dataframe，否则默认情况下它们不会返回副本。例如：df.drop("ColA", axis=1)实际上不会删除列，但如果我需要修改数据帧，则需要通过df = df.drop("ColA", axis=1)或df.drop("ColA", axis=1, inplace=True)实现它。这似乎是其他一些熊猫功能的情况。因此，我通常要做的是为每个函数重新定义一个数据帧，这样我就可以确保它被修改。例如： df = df.set_index("id") df = df.sort_va

浏览 3提问于2020-09-18得票数 0

2回答

如何在熊猫data_frame.info()中排序行

python、pandas

努布问题我不知道如何/是否可以像常规数据帧一样对熊猫数据帧.info()调用的对象输出进行排序。示例： import pandas as pd temp = pd.DataFrame(data={"x":[1, 2, 3, None, 4], "y":[5, 6, 7, None, None]}) temp.info(null_counts=True).sort_values(by="Non-Null Count") 结果：AttributeError: 'NoneType' object has no attribute &

浏览 7提问于2022-01-31得票数 1

回答已采纳

3回答

在Python中过滤数据帧

python、pandas

我有一个包含2列的数据帧，如下所示： Index Year Country 0 2015 US 1 2015 US 2 2015 UK 3 2015 Indonesia 4 2015 US 5 2016 India 6 2016 India 7 2016 UK 我想创建一个新的数据帧，其中包含每年国家的最大计数。新的数据帧将包含3列，如下所示： Index Year Countr

浏览 0提问于2017-08-12得票数 2

1回答

在pandas数据框行中求第k个数最小值的方法

python、pandas、performance、dataframe、series

给定一个m行n列的数据帧，我希望每行的列名都是minimum。我使用的是for循环。接下来，我使用获得的列执行测试，如果测试失败，我希望在同一行中使用第二个最小值，依此类推。我当前的代码对每一行的数据帧进行排序。当然，第一个值是最小值。我执行测试。如果测试失败，我转到第二个值，依此类推。代码附在下面。data和dfObj是pandas数据帧对象。 for i in data.index: #for each row dfObj = data.sort_values(by = i, axis=

浏览 18提问于2020-05-14得票数 0

1回答

逗号分隔的in字符串映射到python Pandas中的值

python、pandas

我在pandas DataFrame的列中有一个逗号分隔的字符串： ? 我有一个映射数据帧 ? 我想要最终的数据帧： ? 我想要一个新的列，并用映射数据帧中的值替换ids，写pythonic + pandas的方法是什么？

浏览 22提问于2021-11-02得票数 0

回答已采纳

5回答

将pandas dataframe中的列移动到大型dataframe中的最后一列的最佳方法

python、pandas、dataframe

我有一个包含100多列的pandas数据框架。例如，在以下df中： df['A','B','C','D','E','date','G','H','F','I'] 如何将日期移到最后一列？假设数据帧很大，并且我不能手动编写所有的列名。

浏览 236提问于2019-10-04得票数 4

回答已采纳

4回答

从一列的每个单元格到另一列的单元格的一对多数据帧

python、pandas、dataframe

一个2列的简单数据帧，我希望每一列中的内容都能相互合并(或并排列出)。例如： ? 似乎有一种简单的方法，但我无法回忆和检索它。我试过“爆炸”和“熔化”，但它们都不起作用。 import pandas as pd data = {'name': ["David","Mike","Kate"], 'info' : ["Department","Titile","Gender"]} df = pd.DataFrame(data) df = df.explo

浏览 95提问于2020-12-12得票数 1

回答已采纳

2回答

Pandas:从一列中为另一列中的每个唯一值获取最大值

python、pandas

如何在一列中为另一列中的每个唯一值获取最高值，并返回相同的数据帧结构。这是一个熊猫数据帧的例子？ reg.nr counter value ID2 categ date 1 37367 421 231385 93 A 20.01.2004 2 37368 428 235156 93 B 21.01.2004 3 37369 408 234251 93 C

浏览 5提问于2017-02-05得票数 7

回答已采纳

1回答

pandas dataframe列按最大负值优先排序

python、dataframe、sorting

我想首先按最大负值对pandas数据框中的列(包括浮点数)进行排序。例如，我的df"values"=0.00378,00878，-0.001，-0.00487谢谢

浏览 1提问于2020-09-17得票数 0

2回答

如何按特定列对多级pandas数据框进行排序？

python、pandas

我希望按列对多索引pandas数据帧进行排序，但不希望一次对整个数据帧进行排序。而是希望按其中一个索引进行排序。下面是我的意思的一个例子:下面是一个多索引数据帧的例子。 first second bar one 0.361041 two 0.476720 baz one 0.565781 two 0.848519 foo one 0.405524 two 0.882497 qux one 0.488229 two 0.

浏览 1提问于2020-06-05得票数 1

1回答

Python -更改列名、合并和重新排序数据帧

python、pandas

我有两个DataFrames - DataFrameA和DataFrameB DataFrameA ID ColA ColB ColC 1 12 23 40 2 21 24 45 3 23 31 50 DataFrameB ID ColA ColB ColC 1 21 23 40 2 20 44 45 3 29 51 70 4 49 51 70 我想要一个这样的输出DataFrame，在变量中声明的DataFrame B列的前缀= "BBBB

浏览 10提问于2019-01-25得票数 1

回答已采纳