pandas在另一列中获取每个组的最高频率值

、、

我有一个这样的Pandas数据帧：0 0 blue medium 12blue small 44 3 red small 4我想要的输出是基本上，对于每一组“颜色”，我想要频率最高的“大小”。我在这方面真的有

浏览 18提问于2020-05-22得票数 1

回答已采纳

1回答

使用spark sql计算数据帧中列的频率

、、、

我正在尝试获取Spark dataframe列中不同值的频率，类似于Python Pandas中的"value_counts“。我的意思是，表列中出现频率最高的值(如秩1值、秩2、秩3等)。在预期输出中，1在列a中出现了9次，因此它具有最高

浏览 1提问于2017-07-21得票数 0

3回答

比较每行数据框列中的元素- Python

、、

我有一个非常大的数据帧(有很多行)，但让我们假设它是这样的：0 2 5 2 2 2 22 5 2 52 5 54 5 5 5 5 5 5 我需要查看在每行的一组列中出现频率最高的值。例如，在每行的列ABC和列</em

浏览 0提问于2019-05-01得票数 5

1回答

如何最好地将两个数据集的分类值的频率与Pandas进行比较？

、、、

我试图比较两组数据，每组数据都使用Pandas和Matplotlib列出的分类变量。我希望通过对每个数据集使用value_counts()方法来获取并以某种方式存储每个变量的值频率，以便以后比较这两个变量在这些频率上的显著差异。到目前为止，我只使用一个函数将数据帧中每一列的值和计数显示为饼形图，给出了在函数外部

浏览 7提问于2022-10-23得票数 0

1回答

使用双数组查找模式？

、、

我一直在讨论如何编写一个函数，该函数使用数组及其长度作为参数，找到数组中包含的一组或多个整数的模式。我在网上找到了关于如何找到数组模式的多个解决方案，但我正在尝试通过以下方式解决这个问题：假设原始数组包含(0，0，1，5，5，5，7，7，7)。我希望使用一个循环遍历数组，该循环可以在不存储模式的情况下找到最高频率，并将这些频率存储在另一个数组中

浏览 1提问于2017-02-22得票数 0

3回答

将两个文件的散列合并为一个文件

、、、、

我有两个文件包含这样的数据：FILE1：2 1 0.61 3 0.4等等我想创建另一个包含FILE2的文件，其中包含来自FILE1的每个开关的值，如下所示： 1 0.9 2 0.6 3 0.4 ..

浏览 3提问于2014-02-10得票数 1

回答已采纳

1回答

SQL Transpose列，将唯一组合的频率作为新值

、、、

我正在尝试使用postgresql来总结一些数据，并需要生成一个频率列，然后转到另一个列，其中包含来自频率的结果。| GBR | Rover我想创建一个新的列，它计算其他列的每个唯一组合的频率。| Fiat | 1 Sep-15 | TUR | Fiat

浏览 8提问于2016-08-10得票数 0

回答已采纳

4回答

标识列中出现频率最高的值(字符串)

、、、、

我有一个csv格式的非常大的数据集(10 GB)，其中包含各种列和行。其中一列是某类个人的is (表示为字符串)。ID在数据中都是加扰的，并且每个单独的ID可能会多次出现。我想要找到数据中出现频率最高的个人的ID。理想情况下，我希望计算每个ID在数据集中出现的次数。最后，我还想对各个‘d进行统计分析。完成这项任务的最快方法是什么

浏览 1提问于2019-02-22得票数 0

2回答

查找堆栈中最多的匹配项

我是编程新手，所以如果这个问题很简单，请接受我的道歉。我的老师希望我们创建一个方法，该方法在堆栈中搜索最常出现的名称并返回该名称老虎伍兹，杰克·尼古拉斯，阿诺德·帕尔默，杰克·尼古拉斯，吉米·德梅里特，杰克·尼古拉斯，山姆·斯奈德，吉米·德梅里特，本·霍根，沃尔特·黑根，汤米·阿莫尔，鲍比·琼斯请帮助我，因为我需要知道如何为我的程序做这件事提前谢谢你

浏览 1提问于2012-01-18得票数 1

1回答

pandas返回表中最高值的索引

、

我有一个pandas数据框(自动索引为0到n-1)，它包含多个列，其中包括“价格1”、“价格2”、“价格3”等。我对查找列"name“的值感兴趣，该行具有最高的价格(从所有”价格x“列中选取的最高价格)。I knowI可以在我的表中选择一个只包含价格的视图，然后执行price_table_view.values.max()以获得最高价格

浏览 17提问于2017-01-29得票数 1

1回答

根据另一个列值的顺序对表中的所有行进行编号

、

我目前有一个有497k字的表格。每个单词及其在英语中的相对频率是一行。我想做另一个列，它将根据它们的频率从1到497k (这个列表中的单词数)排序，最高频率为1，依此类推。我该怎么做呢？我使用的是MySQL 5.1.54

浏览 3提问于2012-07-11得票数 0

4回答

从组中的每一列检索最频繁的值

、

对于使用字段GRP分组的每个组，我希望检索A列中出现频率最高的值和B列中出现频率最高的值，并可能对许多其他列执行此操作。AS freq2 ON freq2.GRP = freq1.GRP它看起来不是很有效，如果我添加一个C、D等列，效率就更

浏览 0提问于2014-11-21得票数 4

1回答

求词频率、最大词频和总字数的有效算法

、、、

我试图找出每个单词出现在文件的一个部分的频率和该部分的总单词数。例如，如果有一个文件: file.txt：这是一个文件部分，它是file.This的一部分，是另一个文件部分，它是由散列分隔的同一个文件的一部分。我希望找出每个词的频率，哪个词在每一节中的频率和总字数都是最高

浏览 2提问于2016-01-04得票数 1

1回答

熊猫:在设定的阈值以上找到最终频谱

、、、、

长时间的读者，第一次发帖。其中x=频率，y=振幅数据。由此产生的每一个地块看起来如下：我可以为Dataframe中的x，y数据的每一行创建一个图。在Pandas (Python)中，我需要做的是在频率响应下降到噪声地板(永久)之前识

浏览 3提问于2020-03-11得票数 3

1回答

如何对与Pandas创建的每个组相关的一系列数据求和？

、、

在Python pandas数据框中，假设我使用pandas groupby()方法对数据进行分组，结果如下：我如何从Third列中分别计算每个组(这里是A和B)的值的总和，这样我就可以在一个单元格中获得每个主要组的总和值例如，我可以将12+32+43放在组A的新单元

浏览 0提问于2018-08-05得票数 0

1回答

组内线性插值

、

假设我有一个包含一个列A的多索引数据帧df。我想创建一个新的列B，将值m (例如0)和M (例如1)赋给每组列A中的最低值和最高值，同时对其间的所有值进行线性插值。 A X Y

浏览 1提问于2014-05-13得票数 3

1回答

基于熊猫数据中其他分类值的缺失值填充

我想用另一个类别中最常见的值来填充Pandas数据帧中缺少的分类值。例如,import numpy as np data = {'type': ['softdrink', 'juice', 'softdrink', 'softdrink如果没有分类组，我的解决方案是按列

浏览 2提问于2017-10-02得票数 3

1回答

作图，x的2个条件

、

我正在使用pandas从最高法院的文件中绘制几个数据图表，我需要创建一个条形图，显示每个法官在每个“方向”的票数。文件中有一个标题为"direction“的列，它由1或2组成，表示该位置是保守的还是自由的。我希望图形显示x轴上的每个值为"(justiceName)，1.0“(相同的<

浏览 0提问于2018-03-17得票数 1

3回答

如何在每个id组中选择列中最频繁的值？

、、、

| 21 | 51 | 31 | 7 我想编写一个返回两列的查询:一列表示用户id，另一列表示每个id出现频率最高的值。在我的示例中，对于user_id 0，最频繁的值是6，对于user_id 1，最频繁的<

浏览 0提问于2016-12-14得票数 17

1回答

将与另一列中最频繁的项目相关联的列中最频繁的项目分组

、、

有了下面的数据框，我想在“第一”列中找到两个最频繁的组，并在每个组中找到“第二”列中最频繁的两个组。df = pd.DataFrame({'first': list('cbbcbcbccabc'), 'second': list('zvvzwyzyxxwz')})获取 first second我们希望在“c”和“b”组

浏览 2提问于2021-04-23得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用spark sql计算数据帧中列的频率

比较每行数据框列中的元素- Python

如何最好地将两个数据集的分类值的频率与Pandas进行比较？

使用双数组查找模式？

将两个文件的散列合并为一个文件

SQL Transpose列，将唯一组合的频率作为新值

标识列中出现频率最高的值(字符串)

查找堆栈中最多的匹配项

pandas返回表中最高值的索引

根据另一个列值的顺序对表中的所有行进行编号

从组中的每一列检索最频繁的值

求词频率、最大词频和总字数的有效算法

熊猫:在设定的阈值以上找到最终频谱

如何对与Pandas创建的每个组相关的一系列数据求和？

组内线性插值

基于熊猫数据中其他分类值的缺失值填充

作图，x的2个条件

如何在每个id组中选择列中最频繁的值？

将与另一列中最频繁的项目相关联的列中最频繁的项目分组

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐