Python pandas - groupby()跳过Dataframe中的重复值 - 腾讯云开发者社区

文章/答案/技术大牛

发布

2回答

Python pandas - groupby()跳过Dataframe中的重复值

、

我有一个pandas dataframe，我使用groupby()函数对它进行分组，除了pandas跳过了重复的值，只显示唯一的值。Statistics'], df = pd.<

浏览 32提问于2019-06-21得票数 0

回答已采纳

2回答

附加和处理重复

、

我有一个带有timeseries数据的df。现在，我想添加更多的数据，通过使用DataFrame.append()来实现。将附加的数据包含新列和重复值。因此，我通过在追加后删除重复的值来清理。有更好的办法吗？2021-02-11 17.089 16.316 15.733 15.630 2021-02-10 1

浏览 2提问于2021-02-16得票数 0

2回答

删除特定数字的连续值- Python Dataframe

、、、、

如何删除特定值的连续重复项？我知道groupby()函数，但它会删除任何值的连续重复项。请参阅下面的示例代码。特定值为2，其中我想要删除重复项 import pandas as pd# This do

浏览 8提问于2020-08-04得票数 1

1回答

如何将两个pandas列转换为一个字典，但将同一第一列(key)的所有值合并为一个key？

、

很抱歉标题很混乱，基本上我有一个Pandas数据帧，我想把两列转换成一个字典(一个是键，另一个是值)。但是，当我使用to_dict()时，问题是因为我在第一列中有许多行具有相同的值，所以它只使用其中的一行，并且我没有获得所有数据。有没有办法解决这个问题？i in range(len(data.index)):现在，datalist拥有来自column1的所有值<

浏览 4提问于2018-07-29得票数 0

回答已采纳

1回答

在pandas中合并和重新排列两个数据帧

、

value20100102 country2 5我想将它们合并到一个数据帧中，country220100102 2 5在熊猫身上有什么聪明的方法可以做到这一点吗

浏览 1提问于2014-01-29得票数 0

1回答

如何使用pandas/python使用groupby仅计算唯一值？

、

我能对这个熊猫数据帧做些什么，让它只计算"Unique_Id“的唯一/不同的值？我尝试的每一件事都给了我独特的社区价值，否则就会抛出一个错误。df.groupby("Community")["Unique_Id"].count().sort_values(ascending = False) 这是我得到的输出： Comunidad_Autónoma

浏览 17提问于2020-03-20得票数 0

1回答

如何在带有Decimal类型值的pandas* TimeSeries上使用mean方法？*

、、、

我需要在pandas TimeSeries/DataFrame对象中存储Python decimal类型值。在TimeSeries/DataFrame上使用"groupby“和"mean”时，Pandas给了我一个错误。ts.groupby([by('year'), by('month'), by('day')]).mean() Fil

浏览 4提问于2012-07-13得票数 5

回答已采纳

2回答

Dask群-运用行为举止

、、

在这个测试示例中，我试图在dask中运行groupby。import pandas as pdtdf = pd.DataFrame({'a': [1, 2, 3, 4, 5, 6, 7, 8, 9],'b': [4, 5, 6, 3, 2, 1, 0, 0, 0]},ddf = dd.from

浏览 3提问于2017-09-19得票数 2

1回答

如何求和并将一个DataFrame表示为创建另一个DataFrame

、、

在使用列中一些重复的单元格值创建DataFrame之后，名称df = pd.DataFrame({'Name': ['Will','John','John','，其中合并了Name列中的重复值，没有留下重复的值。()命令将求和函数应用

浏览 2提问于2016-09-03得票数 6

回答已采纳

1回答

第一个的Pandas* groupby不会跳过None值*

我有一个包含None值的数据帧当我尝试使用first执行groupby时，它不会跳过这些值，并且无法在分组前将它们转换为空值 import numpy as npdf = pd.DataFrame(np.array([(1, 29),(1, 50),(2, None),(2, 12),(3,None)]),columns=['day', 'amount']) df.<em

浏览 183提问于2021-07-21得票数 0

3回答

如何在Python中对CSV文件的每个类别的值求和？

、

假设我有一个csv文件，其中列出了在不同品牌的智能手机上花费的金额，例如：Samsung, 600Apple, 800Google, 240Apple, 640Apple, 1600Google, 700这是一个非常简单的例子，我的实际数据集比这个要大得多，也更复杂，但我仍然想

浏览 4提问于2020-08-25得票数 0

1回答

尽管尝试了许多版本的蟒蛇，熊猫还是不会进口。

、、

pandas.core.groupby.groupby import ( from pandas.core.frame import DataFrame File "C:\Python</em

浏览 0提问于2018-05-18得票数 0

回答已采纳

2回答

pandas中的rank方法中的ValueError没有更多解释

、

/lib/python2.7/dist-packages/pandas/core/groupby.pyc in wrapper(*args, **kwargs)我的DataFrame的形状由大约9.000.000行和15列

浏览 4提问于2017-01-12得票数 3

回答已采纳

2回答

为什么意味着()在空DataFrames上有不同的行为？

、、

如果我在熊猫里有一个空的DataFrame，像这样：>>> dfColumns/site-packages/pandas/core/groupby.py", line 666, in mean return se

浏览 2提问于2014-10-10得票数 2

回答已采纳

2回答

AttributeError:模块‘熊猫’没有属性'DataFrame‘。语法是正确的

、、

(userInput)) from pandas.core.groupby\pandas\core\groupby\__init__.py", line 1, in <

浏览 4提问于2019-10-09得票数 0

回答已采纳

1回答

koalas groupby* -> apply返回‘无法插入"key"，已存在“”*

、、、

我一直在努力解决这个问题，但一直无法解决，我得到了最新的数据框架： import databricks.koalas as ks {'dsindicator=lambda x: x['a'] < np.percentile(x['b'], 80) .astype(int) ) 而df应该是一只熊猫的DataFrame如果我使用pandas</e

浏览 36提问于2020-03-22得票数 0

回答已采纳

3回答

只保留来自Pandas* Dataframe的唯一副本*

、

，我遇到了几个实例，在这些实例中，我希望返回所有重复的行，但每个重复只返回一行。我正在用Python 3在Pandas中尝试这样做。 x.groupby(list(x.colu

浏览 0提问于2019-08-13得票数 0

回答已采纳

1回答

从这个问题：Python: Best Way to remove duplicate character from string答案： ''.join(ch for ch, _ in itertools.groupby(string_to_remove) 我知道如何删除重复的字母只存在于彼此相邻的位置，如何将此解决方案应用于pandas中的列？df： df=pd.DataFrame({'A':[

浏览 9提问于2019-06-24得票数 1

回答已采纳

1回答

dask groupby* agg加权平均“未知聚合lambda”错误*

、

在Dask中，我需要基于第三列从两列的分组值计算加权平均值。() 在Pandas中，我耗尽了内存。在Dask中，我得到了： File "<ipython-input-16-0beb32700c04>", line 3, in <module> File "/anaconda3/lib/python3

浏览 35提问于2019-08-27得票数 2

1回答

“”文本中的简单群示例失败

、

我刚开始学习python (主要是使用"ipython“作为matlab的开源替代品)，学习”“文本中的示例。在第253页上，使用'groupby‘(传递数组列表)显示了一个简单的示例。我和文本一样重复它，但是我得到了一个错误："TypeError：'Series‘对象是可变的，因此它们不能被散列。“from pandas import

浏览 1提问于2014-06-19得票数 3

点击加载更多