删除groupby函数中的值_使用groupBy函数删除重复的列_Python中的.groupby函数 - 腾讯云开发者社区

python、pandas

我需要构造一个groupby，其中保留给定组中具有最小值的所有记录，并删除其余的记录。每组的值数量可能会有所不同。我怎么能这么做呢？提前感谢

浏览 7提问于2020-06-28得票数 0

2回答

删除特定数字的连续值- Python Dataframe

python、python-3.x、pandas、dataframe、itertools

如何删除特定值的连续重复项？我知道groupby()函数，但它会删除任何值的连续重复项。请参阅下面的示例代码。特定值为2，其中我想要删除重复项 import pandas as pd# This does not wo

浏览 8提问于2020-08-04得票数 1

2回答

播放Scala - groupBy删除重复值

scala、playframework、scala-collections

我将groupBy函数应用到List集合中，但是我希望删除Map的值部分中的重复值。下面是最初的列表集合：1 1 101 2 30当我将g

浏览 0提问于2014-10-14得票数 1

回答已采纳

2回答

Python pandas - groupby()跳过Dataframe中的重复值

python、pandas

我有一个pandas dataframe，我使用groupby()函数对它进行分组，除了pandas跳过了重复的值，只显示唯一的值。Statistics']] df = pd.DataFrame(data, columns = ['Provider', 'Type', 'Downloads JR1 2017', 'Field']) 现在，我使用groupby函数

浏览 32提问于2019-06-21得票数 0

回答已采纳

1回答

MOLE4.2-DWL2.0- groupBy结果后需要去除groupBy

json、mule、mule4

在DWL2.0中执行groupBy操作后，我需要从实际数据中删除groupBy字段及其值。例如[ "empId": 1, "deptName": "Sales" {groupBy --> <ee:transform do

浏览 6提问于2019-11-19得票数 0

回答已采纳

1回答

如何删除特定行( DataFrame )以生成嵌套JSON

python、python-3.x、pandas、dataframe

我目前正在开发一个d3树状图，它需要一个嵌套的json作为条目，我成功地组织了自己的df并生成了json，但是我的一些树状矩形比其他的要大30倍，所以我决定删除生成这个矩形的行。我的函数dropSmall()在我的列和行中迭代，以验证每个组的和是否比我正在努力更新df的最大和小30倍，或者使用drop或者影响匹配的值，这里是我的

浏览 0提问于2019-05-21得票数 0

回答已采纳

1回答

spark dataframe覆盖创建重复项

dataframe、scala、apache-spark、duplicates

我在df中有一个groupby函数，如下所示： .option("header","true") .load(ou

浏览 2提问于2021-11-30得票数 2

1回答

如何解决TypeError:序列项0:预期的str实例，浮点找到？

python、python-3.x、pandas、pandas-groupby

我试图使用groupby方法组合列的单元格值(字符串)。但我遇到了以下错误。TypeError:序列项0:预期的str实例，浮起 docs_per_topic = docs_df.groupby(['Topic'], as_index = False).agg下面是我读取CSV文件的代码。data = pd.read_csv('my_file.csv') data = data['Articles&#x

浏览 3提问于2020-10-07得票数 3

回答已采纳

1回答

我们如何计算数据帧列中的重复数，并将结果分配给同一数据帧中的新列？

python、python-3.x

我在一个数据帧的一列中有几个重复的地址，我想计算一下被复制的地址。我尝试了以下代码。import pandas as pddf['count'] = df.groupby(['Street'])['Street'].count() df['count'] = df.groupby(['Street'

浏览 8提问于2020-10-16得票数 2

2回答

与字符串一起工作的熊猫平均函数

python、arrays、pandas、apply、pandas-groupby

我需要在Pandas上操作的聚合函数(均值、std、var、min、max等)，可以从groupby().apply()调用它们，但如果它们的值都是相同的，则不会删除字符串。熊猫的行为(正如人们所预料的那样)是删除非数字值： 'c

浏览 1提问于2018-09-03得票数 1

回答已采纳

1回答

如何计算特定列值的最小最大平均值并将其存储在新列中？

scala、apache-spark、apache-spark-sql

我是Spark/Scala的新手，所以我有很多问题，其中之一就是。我有一个数据帧，其中包含代码，描述，depdelay。列code有重复的值示例(EA)我想在新列中使用code的不同值和depdelay的min，max，avg。

浏览 0提问于2019-08-28得票数 0

2回答

如果满足某些GroupBy条件，则从原始Pandas数据中删除行

python、pandas、dataframe、pandas-groupby

我正在尝试构建一种快速Pandas方法，用于在满足某些条件时从Dataframe中删除某些行。具体来说，如果该行中的其他值等于0，则我希望删除dataframe中某些变量的第一个匹配项。，我想查看第一行，如果该行中的'bar’值= 0，则将其从dataframe中删除。时，我需要删除第一行(即在原始数据帧中删除

浏览 4提问于2020-02-10得票数 2

回答已采纳

1回答

`groupby.unique`函数与`groupby.first`函数的区别

python、pandas、numpy

我正在尝试将两个邻居的名字和相同的邮政编码合并到一个dataframe中。最初我使用groupby.unique()函数，但它在每个单元格中返回一个ndarray。后来我尝试了groupby.first()函数，它返回重复的邮政编码的值。Toronto','Downtown Toronto'],'Neighbourhood':['Vict

浏览 0提问于2019-02-03得票数 0

回答已采纳

1回答

使用LINQ删除重复项返回“删除重复项错误:无法将'System.Int32‘类型的对象强制转换为’System.String‘”。

c#、.net、linq、datatable

我使用以下函数删除了一个名为keyField的DataTable字段的所有重复值。keyField) IEnumerable<DataRow> uniqueContacts = dt.AsEnumerable() DataTable dtOut = uniqueContacts.CopyToDataTable();} 但是，

浏览 1提问于2015-01-08得票数 2

回答已采纳

2回答

如何在Pandas中从groupby对象中选择不同的行

python、pandas

我试图根据以下条件从groupby对象中删除行： A 0 A 25 C6如果想要删除值小于10的任何内容，只需调用df[df['value']>=10]即可。我似乎找不到一种方法来做类似的事情，用一个groupby来获得。 A 20 A

浏览 6提问于2014-01-15得票数 2

4回答

如何提高熊猫行操作的速度？

python、pandas、performance、data-science

我有一个有11'000'000行和3列的大型.csv文件: id、magh、mixid2。我要做的是选择具有相同id的行，然后检查这些行是否具有相同的mixid2；如果为True，则删除这些行；如果为False，则使用所选行的信息初始化一个类。这是我的代码： obs=obs.set_index('id')#dropping elements with only one mixid2 an

浏览 17提问于2020-07-05得票数 2

回答已采纳

1回答

c# LINQ AsEnumerable分组位置

c#、linq

我有一个返回给UI层的datatable。我有多个具有相同FirstId值的表。其中一些可能在FieldOne中有价值。我只想对FieldOne为null的记录进行分组。我尝试使用.Where和.Groupby执行以下LINQ语句，但.Where删除了FieldOne中具有值的所有记录，然后执行GroupBy。在UI网格中，缺少具有FieldOne值的记录。我希

浏览 5提问于2018-01-26得票数 1

3回答

如果值小于10，如何删除dataframe中的行

pandas

如果某一列中的值小于10，我希望删除数据帧中的行。使用dataframe2.groupby('category_id').Description.count()，我可以列出数据帧中的项，这很好用。现在我想删除值小于10的行。我试图创建一个条件，以便删除行，但这不起作用。if dataframe2.groupby('

浏览 3提问于2019-08-07得票数 0

2回答

Pyspark将列列表放入聚合函数

python、apache-spark、pyspark、apache-spark-sql

我有一个关于Pyspark中的udf的问题和一个具体的案例。我正在尝试创建一个简单的、可重用的函数来聚合不同级别和组上的值。输入应为：现有数据帧 group by的变量(单列或列表) 要聚合的变量(同上) 要应用的函数(可以是一个特定的函数，也可以是它们的列表)。我保持简单的求和，平均，最小

浏览 60提问于2020-11-26得票数 0

回答已采纳

1回答

Python -忽略NaN时取Pandas groupby内部的加权平均值

python、python-2.7、pandas、numpy

我需要按日期对Pandas数据帧进行分组，然后取给定值的加权平均值。下面是当前是如何使用边距值作为示例的(在有NaN值之前，它可以很好地工作)：# Create new columns as required 'margin_WA': group_wa(), # agg_func includes WAs for other elements result = df.<e

浏览 0提问于2017-03-27得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云