通过使用pandas提取和分组列来汇总数据帧

、、

我想总结一个csv文件中的列。相当多地提取列数据，并将其与相关评级和计数相匹配。另外，你知道我应该如何匹配预期的数据帧和网站图像吗？

浏览 17提问于2019-01-22得票数 0

4回答

Pandas -按一列分组，按另一列排序，从第三列获取值

、、、

我想以pandas数据帧为例，按一列对其进行分组，按另一列对其进行排序，并从第三列中提取第一个元素并填充原始数据帧。这是我最初的df。我会按col_1分组，按col_2 (升序)排序，从col_3中取出第一个元素，然后用结果填充col_4。我可以通过group和transform来完成分组和排序，但如何<em

浏览 120提问于2019-06-01得票数 2

回答已采纳

1回答

如何使用dplyr汇总分组数据中的级数(n级)？

、

在分组之后，我想使用dplyr中的汇总函数来提取数据帧中每个变量的层数。以下是数据帧的副本： x=c("A","A","A","A","A","B","B","B","B","C","C","C","D&q

浏览 5提问于2017-12-22得票数 1

1回答

我有一个包含3列的数据集: Category、Country和Count (它总是1-实际上是非常无用的)。我想要实现的是类似于这里的黄色列：我可以用python做一个简单的group by，但这不是我想要的，因为我想保留数据的各个行，不同于下面的图像(对它们进行分组)：我只想得到基于两列的频率，而不是分组，你有什么想法吗？我想过使用for循环进行迭代，但我做不到，因为我是python的初学者，所以我非常感谢您

浏览 7提问于2019-11-20得票数 0

回答已采纳

1回答

在回归中使用group by在python中定义x和y值

、、

是否可以将数据分组(用于定义x和y变量)，以便直接在regPlot (或任何其他海运功能)中运行回归？我找不到这样的内置功能。例如，在一列中，我有一个分类变量" C "，然后我试图使用每个C类别的中位数来拟合回归线(具有x和y)。有什么功能可以这样做吗？

浏览 18提问于2019-02-26得票数 1

回答已采纳

1回答

基于切片和选择的熊猫索引

、、、、

问:假设您有一个具有m列的pandas数据帧(df.shape == (nxm))。我想通过切片和选择列来提取列的子集，如下所示：df1 = df.iloc[:,[a,b,c:d]]。这个是可能的吗？在这个例子中，结果应该在df1中实例化一个数据帧，其中包含数据帧df的列a、b和c到d。

浏览 15提问于2021-09-13得票数 0

回答已采纳

1回答

使用pull -R时删除输出中的级别属性

、

我正在使用dplyr查找一列中的最大观测值。我通过管道传输数据帧，按感兴趣的列分组，使用n()汇总以找到每个组的观测值，从组中筛选出最大观测值，然后提取列值。这将返回我正在查找的值，并列出该列中的所有级别。它看起来像这样：# Levels: level values... 我怎么才能让它只返回我想要的值而不是级别呢？

浏览 17提问于2020-05-18得票数 1

回答已采纳

1回答

动态汇总和重命名PySpark中的聚合列

、、、、

我有一个PySpark数据帧(Df)，其中包含50+列，其中包含一些动态列，这些列可能存在也可能不存在，但它们存在于一个单独的列表(Reqd_col)中。我想对列表(Reqd_col)中存在的PySpark data frame(df)中的那些列进行汇总(按固定列‘region’分组)和汇总总和或计数，汇总列的名称应与列的原始名称相同，而不是Py

浏览 24提问于2021-09-08得票数 0

1回答

如何将timestamp列分组为每小时，并聚合pandas数据帧中的行

、

我有一个包含每分钟数据的数据帧，它还包含一个date列，用于以时间戳格式跟踪日期。from datetime import datetime import numpy

浏览 7提问于2019-08-14得票数 1

回答已采纳

1回答

从oracle提取数据到python pandas dataframe的速度非常慢。

、、

我正在尝试使用cx_Oracle模块从Oracle数据库中提取数据并将其放入Pandas数据帧中。使用fetchall()函数时，如下所示cursor.arraysize = 1000rows = results.fetchall() 提取速度与使用R O

浏览 3提问于2016-07-06得票数 3

1回答

来自变量的r组数据帧

、、

我希望设置将数据帧分组为变量的列，然后根据该列对数据框架进行分组和汇总，即var <- colnames(mtcars)[10]这样，我就可以简单地更改var并使用第二行而无需更改任何内容。

浏览 6提问于2016-09-09得票数 0

回答已采纳

2回答

如何为分组中的每一列创建多个汇总统计信息？

、、

使用groupby().agg()可以计算指定列的汇总统计信息。但是，如果我想为每组数据帧的每一列计算“min”、“max”和“mean”，该怎么办？有没有办法让pandas自动为每个列名附加一个前缀？我不想枚举agg()函数中的每个基本列名。

浏览 8提问于2021-07-20得票数 0

1回答

获取数据框中位数的最佳方法是什么

、、、

我有一个Python数据框，其中有两列: Type和Value。我需要所有时间的中位数，缓存未命中，tx-start，...，上下文切换所有数据类型都是Object，如何获取时间为浮点型，其余为整型? 1：

浏览 2提问于2020-07-27得票数 0

1回答

按sklearn.model_selection.GroupShuffleSplit分组数据

、、、

我在CSV中有一个数据集，标题为我希望通过对product_type或任何其他列中的数据进行分组来创建测试和训练数据集。还要确保相同的数据在测试和</

浏览 1提问于2018-01-18得票数 0

1回答

按日期绘制分组数据

、

我正在尝试绘制一些pandas数据帧列的计数，按日期分组：数据是正确的，但是我指定的data.index.day不适合绘图：有没有一种方法可以指定我想按Python Date对象分组，或者我这样做是完全错误的？我应该单独提取它们吗？

浏览 1提问于2013-05-03得票数 2

回答已采纳

1回答

groupby后的列总数百分比

、

尝试汇总pandas数据帧，并根据原始df的groupby结果计算"percent of total“列。Wetland Hardwoods4 778952.154436 Dikes and LeveesMixed Wetland Hardwoods 610332.066649 我想为

浏览 15提问于2019-07-19得票数 0

回答已采纳

1回答

为什么股票代码和日期不同？

、、

这是我使用Python的早期尝试。我正在从雅虎获得股票数据，但我可以看到股票代码，日期列标题低于高，低，开盘收盘价。import numpy as npimport pandas_datareader as pdr py.init_notebook_mode

浏览 3提问于2020-04-08得票数 2

2回答

Pandas将一个列与多个列关联按列的范围分组

、、、

假设我有一个类似于下面的数据帧(实际数据帧有数百万个观测值)，我如何获得信号列和返回列列表之间的相关性，然后按Signal_Up列进行分组？我尝试了pandas corrwith函数，但它没有给出signal_up列的相关分组 df[['Net_return_at_t_plus1', 'Net_return_at_t_plus5','

浏览 46提问于2020-03-20得票数 0

回答已采纳

2回答

Pandas groupby抛出: TypeError:不可散列类型：'numpy.ndarray‘

、、、

我有一个数据帧，如图所示： --------------------------------------------------------------------------- TypeError/_libs/properties.pyx in pandas._libs.hashtable.Py

浏览 30提问于2019-07-06得票数 2

回答已采纳

1回答

group_by()和summarise()错误

、、

我想通过函数group_by()和friend_count ()制作一个数据帧，其中包含来自另一个数据帧'pf‘的汇总变量的平均值和中位数。但是当我尝试这个命令时，结果如下所示，显示了整个friend_count列的平均值和中位数，而不是按年龄分组。请帮帮我！

浏览 4提问于2018-07-17得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Pandas -按一列分组，按另一列排序，从第三列获取值

如何使用dplyr汇总分组数据中的级数(n级)？

不带group by的两列计数频率

在回归中使用group by在python中定义x和y值

基于切片和选择的熊猫索引

使用pull -R时删除输出中的级别属性

动态汇总和重命名PySpark中的聚合列

如何将timestamp列分组为每小时，并聚合pandas数据帧中的行

从oracle提取数据到python pandas dataframe的速度非常慢。

来自变量的r组数据帧

如何为分组中的每一列创建多个汇总统计信息？

获取数据框中位数的最佳方法是什么

按sklearn.model_selection.GroupShuffleSplit分组数据

按日期绘制分组数据

groupby后的列总数百分比

为什么股票代码和日期不同？

Pandas将一个列与多个列关联按列的范围分组

Pandas groupby抛出: TypeError:不可散列类型：'numpy.ndarray‘

group_by()和summarise()错误

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐