python dataframe .duplicated返回同一值的多个匹配项_即使存在匹配值，Python也会返回空的dataframe_在python中，从同一函数的多个if条件中返回值 - 腾讯云开发者社区

、、、

给定以下数据帧： import pandas as pd 'year36], 'title': ['Ones', 'Twoes', 'Three', 'Four', 'Five', 'Six']}) 我正在尝试获取month专栏中<em

浏览 18提问于2021-07-06得票数 0

回答已采纳

2回答

JavaScript未在数组中检测到indexOf -1

、、、

我有一个简单的脚本，可以让fixture将数组的所有值与所有值进行匹配。inArray) matches.push(z) } })[ 'a', 'b' ] [ 'a', 'c'

浏览 2提问于2018-01-05得票数 0

2回答

Pandas中的.duplicated()方法在值中是否有模糊匹配？

、、、

我正在为我的数据科学课程做一个练习，其中涉及一个数据集，其中包含几条关于Google Playstore应用程序的信息。该练习要求删除任何重复的行和列，并填充任何丢失的数据。因此，我只检查重复项可能有问题的列，即dataset的“App”列。毕竟，其他数据可以而且很可能会重复，因为它是所有人共享的信息，因此我的理由是过滤掉'App‘列中的重复项。通过添加这个序列，我可以得到有多少行是重

浏览 19提问于2021-06-15得票数 0

1回答

如何在Pandas DataFrame中找到在某些列中具有相同/相反符号的相同值的匹配行？

、、、、

对于下面的dataframe，我如何返回第一行和第三行，因为它们在"c“和"d”列中具有相同的值，并且在"a“和”b“中具有相反的值？df1=pd.DataFrame([ [1,2,3,4],[5,6,7,8], [-1,-2,3,4]], columns=['a', 'b', 'c', 'd']) 01 2 3 4 1 5

浏览 3提问于2015-05-27得票数 1

回答已采纳

1回答

Dataframe.duplicated() \ Pandas的奇怪结果

、

在运行string[python]时，我试图在dtype x['comment'].duplicated()的dataframe列中查找重复项，得到以下输出2Name: comment, dtype: string 如您所见，字符串根本不是重复的。因此，我只为这几行重新运行重复的函数；x['comment'].iloc[155071:155075].duplicated()。我是

浏览 5提问于2022-10-06得票数 0

回答已采纳

4回答

检查Pandas dataframe列中的重复值

、、、

中有一种方法可以检查dataframe列是否有重复的值，而不实际删除行？我有一个函数将删除重复的行，但是，我只希望在特定列中实际存在重复的情况下运行它。目前，我将列中唯一值的数量与行数进行比较:如果惟一值少于行数，则存在重复值并运行代码。'].unique()) < len(df.index):是否有一

浏览 5提问于2018-05-08得票数 76

回答已采纳

1回答

如何在一定条件下生成一个numpy数组？

、、

在某些情况下，我想用它做一个新的数组。idx start_lvl end_lvl 67 72 74 我

浏览 3提问于2019-08-01得票数 1

回答已采纳

1回答

如何创建一个For循环，以检查某个列是否包含Pandas DataFrame中的重复项

、、、、

我正在尝试创建一个for循环，该循环首先检查列('col1')是否有重复项，如果为真，则将另一列('col2')的值添加到('col1')。但是，下面的语句工作正常，所有('col1')值都被视为重复值。我确信列中的副本实际上很少，但不知何故，语句始终返回true。我认为问题在于第二行，即包含.duplicated()的 import pandas as

浏览 1提问于2022-07-11得票数 -1

1回答

根据输入数使用dplyr作为过滤器重复使用。

、、

v1由多个标记组成，v2由user_ids组成。一个user_id在v2中可以有多个标记(在v1中)，如下所示：html pietc# klaaspythonin% v2[duplicated(v2)])将很好地返回：html pietc# klaas但是，当在第一个过滤器中使用三个值时

浏览 0提问于2018-11-16得票数 0

回答已采纳

1回答

在pandas中使用regex验证字符串

、、、、

我是Python的新手(我使用的是与Anaconda捆绑在一起的3.0版)，我想使用regex来验证/返回一个只包含符合条件的有效数字的列表(比如11位数字的\d{11} )。['08034382919',11], ['09039292921',11]])for row

浏览 1提问于2017-07-19得票数 1

回答已采纳

1回答

值计数不适用于对象列。

、

同样基于这个和这个，我尝试计算列中的频率。当我在int64列上运行它时：我得到了想要的结果：50 1df['text'].value_counts() AttributeError：“DataFrame”对象没有属性“value_counts” df.groupby('text').cou

浏览 1提问于2020-01-13得票数 0

回答已采纳

1回答

Pandas: DataFrame中重复索引值的平均值

、、

假设我有以下DataFrame： 'b':[4,4,2,4,6,7,8,9]},42010Q2 2 22010Q2 1 62010Q3 3 8注意，每个索引值都是重复的我想要的是返回另一个对重复索引行进行平

浏览 0提问于2018-08-14得票数 0

2回答

熊猫:检查不同数据中列之间的值，并将多个可能的值返回到新列中。

、、、

我试图比较来自两个不同数据格式的两列，并使用python返回所有可能的匹配(类似于excel中的xlookup，但有多个可能的匹配) 请参阅下面的详细资料样本数据和我尝试的工作。我试图查看dataframe 1 (Marks)，并将其与拥有所有其他所有者及其汽车的更大数据集进行比较: dataframe 2(索赔)，并返回Mark汽车的<

浏览 2提问于2022-09-22得票数 1

回答已采纳

2回答

Python熊猫-按行选择

、、

我试图在熊猫数据帧中根据与另一个数据帧的值相匹配的值来选择行。关键的是，我只想在行中匹配值，而不是整个系列。例如：我希望从df1中选择

浏览 3提问于2016-11-16得票数 2

回答已采纳

1回答

跨栏对熊猫数据进行多重质量检查

、、、、

:123,A25668','B1:TEST,B2456,B3#123','B3:456','B3:678,C1:345','C2:367,C3']})( b)列不应包含缺失的值q_1 = np.where

浏览 1提问于2021-07-02得票数 1

回答已采纳

4回答

使用NA标记冗余行

我有一个包含完整和不完整行的data.frame，如下所示： dat <- data.frame( "two" = c(2, 2, NA,4, 4), "four" = c(2, NA, 2, 6, 6) ) 我希望将包含NA的行标记为TRUE，其中它们的值等于同一列中的<e

浏览 53提问于2020-09-09得票数 2

回答已采纳

1回答

如何通过Python字典检测/查找.JSON文件中的重复值

、、

我对Python有点陌生，我正在设法找到JSON文件中的所有副本。到目前为止，我已经创建了这个python脚本来打开和读取JSON文件并解析JSON报告。我需要找到一种方法来查找所有可能的重复事务，并打印每一行以包含日期、数量、描述和transactionID。请告诉我，如果我在正确的道路上，任何建议或指示都会有帮助。

浏览 1提问于2022-07-09得票数 0

1回答

在字符串列表中查找字符串并在pandas中创建新列

、

我是Python新手，正在尝试解决这里的性能问题。我需要在DataFrame2.col1中查找DataFrame1.col1，并使用DataFrame1.col2的值在DataFrame2.col2中创建一个新列，我正在使用循环来实现这一点，这需要很长时间我正在寻找一种有效的方法来做到这一点。此外，如果我得到多个匹配，我应该始终使用从DataFrame1找到的第一

浏览 4提问于2017-07-18得票数 2

1回答

我用的是潘达斯，朱庇特笔记本和Python。我有一个有4列和10000条记录的数据集。当前，当我使用下面的代码来拾取副本时，代码不知怎么地会拾取不正确的记录。，但是sub_origin不匹配，一个是布莱顿，另一个是布里斯班。同样适用于最后两个记录，日期是匹配的，但原产地并不相同。从这一点上，我知道df.duplicated没有收集到正确的记录，或者我没有正确地使用它。数据类型与df.duplicated有关系吗？如

浏览 0提问于2016-06-02得票数 3

回答已采纳

1回答

如果熊猫系列中的值被复制，那么重新计算一个布尔值吗？

、、

给出了以下熊猫DataFrame： mydf = pd.DataFrame([{'Campaign': 'Campaign X', 'Date': '24-09-2014', 'Spend': 1.34: 1}, {'Campaign': 'Campaign Z2', 'Date': '24-08-2014', 'Spend': 4.56, 'Clic

浏览 4提问于2015-09-03得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云