使用预定义的组对熊猫DataFrame进行分组_对熊猫DataFrame进行分组，并分别绘制这些组_如何对熊猫DataFrame中的每10 %进行分组？ - 腾讯云开发者社区

、、、

我想知道，当我有预定义的组，并且元素可能同时属于多个组时，如何有效地执行groupby之类的操作。2 'group 2': ['A', 'B','C&#

浏览 13提问于2019-03-08得票数 1

1回答

熊猫拆分-申请-联合创造不想要的MultiIndex

、、、

我使用熊猫中的拆分应用组合模式来根据自定义聚合函数对我的df进行分组。但这将返回一个不需要的DataFrame，其中分组列存在两次:在MultiIndex中和列中。我想按A列分组，只保留B值为偶数的行。因此，所需的df如下：A 3 4

浏览 5提问于2020-11-22得票数 1

2回答

将自定义函数应用于星火数据访问组

、、、、

我有一个非常大的时间序列数据表，其中包含以下列：我计划在dataframe中使用spark，但我对如何对spark分组数据执行自定义

浏览 2提问于2016-09-20得票数 10

回答已采纳

1回答

利用滚动和与原熊猫DataFrame重组群

、、、

我有一只熊猫DataFrame的表格： 'a': [1,2,3,4,5,6],}) 我希望将数据按'b‘的值分组，并添加新的列'c’，其中包含每个组的滚动和'a‘，然后将所有组重新组合回包含'c’列<e

浏览 1提问于2016-11-28得票数 1

回答已采纳

1回答

PySpark:带有标量Pandas的无效returnType

、、

我正在尝试从pandas_udf返回一个特定的结构。它在一个集群上工作，但在另一个集群上失败。我尝试在组上运行udf，这需要返回类型为数据框架。oneCar.loc[1:, 'Longitude'], distancePerCar= df.groupBy('CarId&#

浏览 2提问于2018-03-26得票数 5

回答已采纳

1回答

ColumnDataSource()是在bokeh web应用程序中更新绘图的唯一方法吗？

、、、

我的数据在一个大型的多索引熊猫DataFrame中。我对DataFrame进行重新索引以使其扁平化，然后通过ColumnDataSource提供给它，但是我需要按行对我的数据进行分组，以便正确地绘制它(考虑与汽车的一组齿轮相对应的一组扭矩曲线)。如果我只是绘制ColumnDataSource的字典输出，它会变得

浏览 1提问于2019-07-24得票数 0

1回答

Pandas Dataframe中的列分组

、、

如果有人能帮我解决我遇到的熊猫数据问题，我将不胜感激。重复列Dataframe------------------01-01 | | 1 | 7 | 1 | | ---------------------------

浏览 0提问于2017-02-22得票数 2

回答已采纳

1回答

如何有选择地过滤大熊猫群体中的元素

我想有选择地删除大熊猫组的元素，根据它们在组内的特性。下面是一个示例:删除“A”列中值最高的行以外的所有元素 >>> grped = dff.groupby('B&#x

浏览 4提问于2014-04-12得票数 2

回答已采纳

1回答

按给定行指数计算的熊猫群DataFrame

、

假设我们有一只熊猫，DataFrame，df，并以某种方式计算了这个DataFrame指数的子样本，我们给这个子样本命名为idx。现在，我希望通过使用df对idx进行分组，即第一个组包含从0到idx[0] (独占)的每一行，从idx[1] (包含)到idx[2] (独占)的下一个组，直到最后一个包含从idx[len(idx)-1]到最后一行的所有行的</e

浏览 0提问于2019-07-13得票数 0

回答已采纳

2回答

熊猫:小组后的样本组

、

我怎样才能在熊猫群后对小组进行取样？比方说我想在小组会议结束后得到前半部分。In [194]: df = pd.DataFrame({'name':['john', 'george', 'john','andrew','Daniel','george','andrew','Daniel], 'hits':[12,34,13,23,53,

浏览 5提问于2014-12-04得票数 2

2回答

函数在熊猫数据群第二列中的应用

、、

在熊猫的数据中，一个函数可以用来对它的索引进行分组。我希望定义一个应用于列的函数。我希望按两列分组，但我需要将第二列按任意函数foo分组如何将foo定义为将第二列分组为两个组或者，是否使用了完全不

浏览 4提问于2016-10-25得票数 8

回答已采纳

2回答

循环遍历分组数据帧中的组

、、、

考虑这个小示例：frame=pd.DataFrame(data,columns=["X","Y","Z"],index=["A","A","A","B","B"])

浏览 12提问于2017-08-21得票数 9

回答已采纳

1回答

在Pandas中对组中的列进行排序

、、

我是第一次接触熊猫。我正在尝试对每个组中的列进行排序。到目前为止，我能够将第一列和第二列的值分组在一起，并计算第三列的平均值。但我仍然在努力对第三列进行排序。我使用以下代码行对输入数据框进行分组，df_o=df.groupby(by=‘组织组’，‘部门’).agg({‘总薪酬’：np.means}) 请让我知道如何使用<

浏览 3提问于2017-04-03得票数 0

1回答

将用户定义函数应用于Pandas中Group By的每个子组

、、

我现在一直在使用熊猫，但我真的很熟悉group by function。我定义了以下函数，该函数最终对新列R、F、M和RFM进行排序和赋值： dfr=dataframe.sort('last_order_date',我将其返回到一个新的df中，然后对其运行一些统计数据。我现在要做的是在数据帧上运行group by函数，按其他列之一对

浏览 3提问于2013-12-10得票数 0

1回答

如何在熊猫中做一些像groupby()和value_counts()这样的操作？

、、、、

这里有一只熊猫，它的定义如下： df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo', 'foo首先，按列A和B对Dataframe进行分组。因此，在这种情况

浏览 3提问于2016-08-23得票数 1

回答已采纳

1回答

对熊猫DataFrame进行分组，并分别绘制这些组

、、、

我有来自不同雨量站的数据，我想用曲线图进行比较。中的每个工作站都连接到10个其他工作站，我想将这些工作站与InputID进行比较。我想创建一个函数，根据我的InputID对数据进行分组，并在我想要单独绘制和使用标题中使用的InputID的组(在本例中为30)之外创建新的DataFrames。station {} at Neckar'.format(sta

浏览 12提问于2020-05-25得票数 1

回答已采纳

1回答

熊猫:如何保存每一组的最后“N”记录，按另一个变量排序？

、、

我想保留每个组的最后一个n行，按照使用熊猫的变量var_to_sort排序。现在我就是这样做的，我想将下面的数据按name分组，然后按date对sort进行分组，然后使用tail(n)获取by-group中的最后一个n元素。', date(2019,4,1), "Don't want"], ['nick', dat

浏览 0提问于2019-08-19得票数 7

回答已采纳

1回答

有效地减少数据帧中组的大小。

、、、

我有一个dataframe，我使用groupby函数根据每一行的名称对其进行分组。然后，我想将每一组缩小到给定的大小。然后，我将这些组添加回数据库以用于其他进程。有什么方法可以让熊猫更有效地做到这一点呢？grouped = df.groupby(['NAME']) for na

浏览 4提问于2022-06-29得票数 0

回答已采纳

1回答

熊猫按两个变量分组，转换为列表，多索引df？

、、、、

我有一只熊猫的资料，看上去如下： 'ID' : ['A','B','C','A','B','C','A','B','C'], 'value': [1,2,3,4,5,6,7,8,9]} )

浏览 0提问于2018-05-10得票数 1

回答已采纳

1回答

如何将大熊猫列按给定类别分组？

、、、、

假设我有一组列，我只想为索引目的对它们进行分组。例如，我有一个dataframe df，其中有26列是从["A",...,"Z"]调用的，它的行是文档中字母的出现。现在，我想把数据分割成“元音”和“辅音”，这样我就可以用像df["Vowels"]或df[["Vowels"]]这样的元音来获得数据。也就是说，是否有一个多指标的方法来解决这个问题或任何其他<e

浏览 3提问于2017-10-16得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云