提取python pandas Dataframe中单个列中包含的分组_Pandas Dataframe分组依据，包含列表的列_按Pandas Dataframe中列中的条目分组 - 腾讯云开发者社区

、、、

这里有一个类似下图的excel文件： ? 在使用pd.read_excel()之后，我有了一个数据帧，如下所示： pd.DataFrame({'Accessory Description':['GROUP1','item1', 'item2',但是，我想要操作数据帧，使其显示如下： pd.DataFrame({'Group':['Group1','Group1','Group1'

浏览 28提问于2021-10-20得票数 0

回答已采纳

1回答

PySpark:带有标量Pandas的无效returnType

、、

我正在尝试从pandas_udf返回一个特定的结构。它在一个集群上工作，但在另一个集群上失败。我尝试在组上运行udf，这需要返回类型为数据框架。from pyspark.sql.functions import pandas_udfimport numpy as np oneCar.loc[1:, 'Lati

浏览 2提问于2018-03-26得票数 5

回答已采纳

1回答

在多个轴上的groupby()上的Pandas - cumsum()

、

我是新来熊猫的。我有一个赛马结果的数据集。* 100 df['HorseWinPercentage'] = df.groupby('Horse')['HorseWinPercentage2'].shift(+1) 然而，当我需要对多个轴进行分组时例如，我要为特定骑师骑特定驯马师的马群(‘Jockey’，‘Trainer’)创建一个获胜百分比。然后我需要知道每个单独的行(比赛)的百分比变化。])['JTWinPercen

浏览 16提问于2019-09-25得票数 1

1回答

熊猫:根据当前索引分组列

、

我有一个熊猫数据框架，我想将其数据分组为列组。列的名称总是"day_replicate“。因此，我正在尝试定义一个函数，该函数只将列分组为几天。def group(a: pd.DataFrame): def get_day(

浏览 4提问于2022-11-23得票数 0

1回答

Pandas DataFrames:提取信息和折叠列

、、

我有一个pandas DataFrame，它包含列中的信息，我想将其提取到新列中。最好从视觉上解释： df = pd.DataFrame({'Number Type 1':[1,2,np.nan], 'Number Type 2':[np.nan该表显示了包含Number Type 1和NumberType 2列<

浏览 15提问于2019-02-27得票数 1

回答已采纳

1回答

具有字典值的DataFrame* groupby列*

、

我有一个包含字典列的dataframe。我需要按字典值按列分组。例如, { "values":{{} } ] df = pd.<em

浏览 2提问于2021-02-08得票数 0

回答已采纳

1回答

如何使用数据帧在函数中编写sklearn.SimpleImputer？

、、、、

most_frequent')df_titanic['age'] 我想把它写在一个函数中，np.array(simple_imputer_func(df_titanic['age'], SimpleImputer, 'most_frequent')) 有没有一种方法，我可以把它们写在一个函数中，然后给函数指定要选择的

浏览 2提问于2021-01-25得票数 0

3回答

在Pandas* DataFrame上迭代以提取数据*

我有一个DataFrame，它在列中包含小时间隔，在行中包含员工ID。我想迭代每一列(每小时间隔)，并仅当该列包含数字1 (1表示在该小时内可用，0表示不可用)时才将其提取到列表中。我已经尝试了iterrow()和iteritems()，但这两种方法都没有给出我想要从这个DataFrame中看到的东西这是一个新列表，名为可用= 0800、0900、1

浏览 22提问于2021-05-18得票数 0

回答已采纳

3回答

在不使用RDD的情况下，如何摆脱中的行包装对象？

、、、、

spark.sql("SELECT temperature FROM washingflat")我只对普通的(未包装的)整数值感兴趣。到目前为止，我对dataframe所做的尝试总是返回包装我感兴趣的值的Row对象。有没有一种不使用RDD来获取标量内容的方法？

浏览 1提问于2016-11-01得票数 4

回答已采纳

1回答

将火花数据转换为Pandas/R数据的要求

、、、、

我在查Hadoop的故事。这种转换是如何工作的？集合()是否发生在转换之前？另外，我需要在每个从节点上安装Python和R以使转换工作？我很难找到这方面的文件。

浏览 4提问于2015-06-22得票数 6

回答已采纳

2回答

从熊猫DataFrame中提取一行时保存dtype

、、、、

从一个 DataFrame (例如使用.loc或.iloc)中提取单个pandas行DataFrame会产生pandas Series。但是，在处理DataFrame中的异构数据时(即DataFrame的列并不都是相同的dtype)，这会导致行中不同列的所有值被强制转换为单个dtype，因为S

浏览 2提问于2020-06-29得票数 0

1回答

聚合空DataFrame时保留列

、、

我在python 2.7.9的pandas 0.18.0中工作。获取一个示例DataFrame并按几列分组，然后对不同的列求和以得到结果，如下所示：>>&

浏览 10提问于2016-07-29得票数 4

6回答

如何在非唯一列中按日期对pandas* DataFrame条目进行分组*

、

Pandas DataFrame包含名为"date"的列，该列包含非唯一的datetime值。我可以使用以下命令对此帧中的线条进行分组：但是，这将按datetime值拆分数据。我想按“日期”列中存储的年份对这些数据进行分组。展示了如何

浏览 1提问于2012-07-09得票数 94

回答已采纳

2回答

从pandas* Dataframe中提取在特定列中具有特定值的所有行*

、、

我是Python/Pandas的新手，正在努力从pd.Dataframe中提取正确的数据。我实际拥有的是一个包含3列的Dataframe：1 a TRUE3c TRUE5 k FALSE 我想要做<e

浏览 1提问于2013-07-02得票数 11

回答已采纳

2回答

Pandas将文本文件转换为CSV

、、

我的文本文件包含5列，由不相等的空格分隔。当我将其转换为CSV文件时，所有这5列都在Excel文件中的单个列中。代码： import pandas as pd dataframe1 = pd.read_csv("C:\HARI_BKUP\PYTHON_SELF_Learning\Funct_Noise_Corners_2p0_A.txt&quo

浏览 24提问于2021-04-27得票数 2

回答已采纳

1回答

在创建新列时自动替换索引

、、

我目前正在按日期(DD/MM/YY)索引的Pandas DataFrame上做一些练习。目前的做法要求我按年分组，以获得平均年值。因此，我试图创建一个新列，其中只包含从DataFrame索引中提取的年份。我写的代码是：data.groupby("year&quo

浏览 0提问于2018-11-02得票数 1

回答已采纳

1回答

在python中将子类转换为维度

、、、

我在python和pandas库中查找了有关python中表的旋转，但还没有找到如何将行中的子类分组到新维度中的方法。例如，我有n列，具有长度、质量、体积、压力、时间等特征，行表示对象A1、A1、A2、A3、A4、A4。我想用Python语言创建具有维度的4D数组--特征、日期和“单个”对象(A1、A2、A3、A4)。因此，rows子类被重新<e

浏览 13提问于2021-03-12得票数 0

1回答

减少复杂熊猫重索引任务的内存使用

、

我有一只大熊猫的数据(1300万行)，其中包含了各种项目的数据，每一个项目都有不同月份的观测结果。项目因相应行数(即有观测数据的月份)而不同，月份可能是连续的，也可能不是连续的。:对于每个项，将该项的第一个观察行的填充观察转发到指定的最大日期。并且生成正确的输出，但是当我尝试在完整数据集上执行操作时(1300万行，通过重新索引扩展了大量数据)，内存的使用就失去了控制(用20 of的

浏览 2提问于2013-11-01得票数 3

1回答

我有单元素数组。我如何将它们转换成元素本身？

、、、

使用records = pandas.read_json(path)将JSON文档导入到熊猫数据中，其中path是JSON文档的预定义路径，我发现生成的dataframe“记录”的某些列的内容并不像预期的那样只是字符串相反，这样的列中的每个“单元”都是一个数组，包含一个元素--感兴趣的字符串。这使得使用布尔索引来选择列<

浏览 3提问于2014-03-26得票数 1

回答已采纳

2回答

按单个列对多列进行分组-- Pandas Dataframe

、、

我试图将B、和C列的平均值按列A分组。我不知道如何使用groupby函数来完成这个任务：pd.DataFrame({'B' : df.groupby(['A'])['B'].mean()}).reset_index()A

浏览 2提问于2017-08-11得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云