为Pandas Dataframe中的每个重复行追加值/索引

文章/答案/技术大牛

发布

2回答

、、、

我有一个排序的Dataframe，其中包含一些重复的ids，我希望通过附加索引来使这些ids具有唯一性，因为它们出现在重复列表中。原始df： id val1 5263 234 4 441 1002 4344 6574-2 121

浏览 18提问于2020-01-05得票数 0

回答已采纳

1回答

熊猫添加了两个具有部分重叠指数的数据？

、、、

Python/Pandas02-10-2017 09:00:00, 0, 2.23, -2.24... datetime是(格式为DatetimeIndex)的索引。现在，每个dataframe都有m个索引/行，并且每个dataframe都会在另一个之后启动特定的<

浏览 1提问于2018-05-24得票数 1

1回答

为什么熊猫的dataframe.index中没有重复的东西？

、、、

我刚刚为大学写了一个程序，使用pandas来组织一些非结构化数据。我确实让它变得更难了，但我最终找到了一些有趣的东西。以下是(针对学校的积极评论)代码，这些代码几乎是不相关的，但为了完整起见，在这里import pandas as pd df.to_csv("new.csv", index=Fal

浏览 18提问于2021-06-03得票数 0

回答已采纳

1回答

Python Pandas-根据给定的窗口并从特定值开始计算特定列的总和

、

我正在尝试在Python Pandas数据框中创建一个新列，其中包含指定范围内另一列的相加值，并从某一行开始。例如，在下面的数据框中，我希望跟踪1的值列的总和从第3行开始(使用索引行号)。但是，我还需要对跟踪2重复相同的标准。此外，我需要从每个跟踪的相同样本号开始。有什么想法吗？

浏览 7提问于2018-07-29得票数 0

回答已采纳

1回答

添加两个不带排序索引的数据帧

、、

如何将2个数据帧中的值按索引值(0表示缺失)相加，而不对索引进行排序。import pandas as pddf2=pd.DataFrame([4,5],['Yesfill_value=0)Maybe 2.0Yes

浏览 11提问于2021-02-03得票数 0

回答已采纳

3回答

熊猫-在新的dataframe列中增加特定iloc的价值

、、

我有一个包含很多列的大数据。对于dataframe中的每一行/索引，我都会执行一些操作，读取一些附加的ata，等等，并获得一个新的值。是否有方法将新值添加到正确的行/索引的新列中？我可以使用.assign添加一个新列，但由于我正在遍历行，而且每次只生成一个值要添加的数据(生成数据非常复杂)。当生成它时，我想

浏览 5提问于2017-09-08得票数 59

回答已采纳

6回答

如何使用pandas查找重复名称？

、、

我有一个包含名为name的列的pandas.DataFrame，其中包含字符串。我想要获取在该列中多次出现的名称的列表。我该怎么做？

浏览 5提问于2013-03-06得票数 21

回答已采纳

3回答

群Pandas* DataFrame重复行，保留最后的索引*

、、

我有一个Pandas DataFrame，它有一个有意义的索引和各种重复行组。假设它看起来像这样： >>> df = pd.DataFrame([[1, 1, 1], [2, 3, 4], [2, 3, 4], [1, 1, 1](除了每个重复批处理中的第一个行)，但是将最后一<

浏览 10提问于2021-10-26得票数 0

2回答

作为DataFrame列的Scipy稀疏矩阵

、、、、

我正在开发基于pandas DataFrame对象的工具。我希望将scipy稀疏矩阵保留为DataFrame的列，而不是将其按行转换为dtype('O')的列表/数值数组。下面的代码片段不起作用，因为pandas将矩阵视为标量，并建议添加索引。当在矩阵中的行索引上提供pd.RangeIndex时，矩阵将对数据帧<em

浏览 12提问于2016-09-12得票数 4

回答已采纳

2回答

附加和处理重复

、

我有一个带有timeseries数据的df。现在，我想添加更多的数据，通过使用DataFrame.append()来实现。将附加的数据包含新列和重复值。因此，我通过在追加后删除重复的值来清理。有更好的办法吗？2021-02-11 17.089 16.316 15.733 15.630 2021-02-10 17.425 16.525 15.

浏览 2提问于2021-02-16得票数 0

1回答

如何在使用drop_duplicates (Pandas* DataFrame)时获得掉行？*

、、、

我使用pandas.DataFrame.drop_duplicates()删除所有列值相同的行的重复项，但是对于数据质量分析，我需要生成一个带有删除的重复行的DataFrame。如何识别要删除的行？我想到了比较原始的DF和没有重复的新的DF，并识别缺少的唯一索引</e

浏览 10提问于2020-07-06得票数 1

回答已采纳

1回答

我计算两列的差值，如下所示： (pd.DataFrame(pd.DataFrame(clf.get_best_score())["validation"] - pd.DataFrame(clf.get_best_score(pd.DataFrame(clf.get_best_score())["validation"] - pd.DataFrame(clf.get_best_score())["learn"])) /

浏览 49提问于2021-01-28得票数 1

回答已采纳

4回答

如何在列表中查找公共元素

、、

我有一个列表l1，看起来像1,2,1,0,1,1,0,3...我希望为每个元素找到与该元素具有相同值的元素的索引。例如，对于列表中的第一个值1，它应该列出列表中存在1的所有索引，并且应该对列表中的每个元素重复相同的索引。我可以编写一个函数来迭代列表，但是我想检查是否有任何预定义的函数。我正在从

浏览 4提问于2016-11-03得票数 0

4回答

pandas中的多列分解

、、、

pandas factorize函数将序列中的每个唯一值分配给一个从0开始的顺序索引，并计算每个序列条目所属的索引。我想在多个列上实现pandas.factorize的等价物：df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2,

浏览 0提问于2013-05-09得票数 12

回答已采纳

2回答

将Python数据帧转换为带索引的字典

、、

我正在尝试将dataframe转换为字典(因为它们在过滤key时速度更快)，我目前正在使用 t3 = time()for i in df.index.unique(): r[i].append(df.loc[i].values) print(round((time()-t3), 1), "s") 这种类型的转换速度很慢。我希望数据帧的索引作为键，行作为在单个键上具有多个值的值

浏览 19提问于2020-08-22得票数 0

回答已采纳

2回答

熊猫:基于重复指标值加速df.loc

、、、

我有熊猫DataFrameimport numpy as np 'x': ['a', 'b', 'c'],'y': [1, 2, 2],}).set_index('x') 其中，我希望根据选择数组<em

浏览 3提问于2015-10-26得票数 6

回答已采纳

3回答

熊猫在第一列合并

、、

我正在尝试合并两个pandas数据帧，它们在我试图合并的条目中有重复的行(这里是由对应于'a‘和’b‘的2组成的行)。因此，pandas采用重复行的笛卡尔乘积，如下所示： In [8]: df1 = pd.DataFrame({'a' : [1, 2, 2], 'b' : [2, 2, 2], 'c&#x

浏览 8提问于2019-03-11得票数 1

1回答

通过在Pandas中的另一列中添加新值来扩展时间索引。

、、、

假设我在Pandas中有以下数据：df = pd.DataFrame(data=np.random.rand(11), index=index , columns=['rand'])07-01 0.7941642017-

浏览 4提问于2017-07-27得票数 2

回答已采纳

1回答

按顺序标注索引以复制DataFrame索引

、

我有一个这样的DataFrame：1 1002 300 01 0 1002 0 300 也就是说，我希望二级索引(在这里称为i2)为零，其中df.duplicated()为False (意味着<

浏览 3提问于2017-07-31得票数 2

回答已采纳

1回答

使用pandas标识指定列中具有重复值的记录

、、

我是Python和Pandas的新手。我正在清理一个包含50,000个设备(50,000行和10列)的数据文件。每条记录的一列('UNITNUMBER')应该是唯一的。但是，也有副本，我正在尝试生成两个数据帧:一个包含UNITNUMBER唯一的所有记录，另一个包含UNITNUMBER在另一条记录中重复的所有记录。，顺序与原始DataFrame相同，索引为UNIT

浏览 9提问于2017-07-18得票数 0

回答已采纳

点击加载更多