腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Pandas
:
查找
具有
重复
项
的
行
集
、
我有一个存储在
pandas
数据框中
的
传感器数据列表,如下所示:12345 2019-01-有时传感器会出现故障,您会看到两
行
具有
相同
的
值,除了显示“EventOn”和“EventOff”对
的
“sensorStatus”。我希望检测每一组匹配
的
行
,这些
行
的
值都是相同
的
,但sensorStat
浏览 33
提问于2019-11-06
得票数 0
2
回答
从dataframe中选择几列
具有
相同值而另一列
具有
不同值
的
行
、
、
我有一个包含四个特征列和一个标签列
的
pandas
数据帧。数据
集
有一些问题。有些
行
具有
相同
的
特征值,但标记方式不同。我知道如何
查找
多个列
的
重复
项
df[df.duplicated(keep=False)] 但是,如何找到标签冲突
的
重复
特征?
浏览 92
提问于2020-04-10
得票数 2
回答已采纳
1
回答
查找
重复
项
并删除整行(使用Do While和If循环)
、
、
我有需要删除
重复
项
的
大型数据
集
。数据有一个包含ID号
的
列-我想在此列中循环
查找
重复
的
ID。如果存在
重复
项
,我希望代码删除
重复
项
。我使用
的
数据
集
总是
具有
相同
的
列-但行数会发生变化,因为我将使用: Do While Cells(b,4).Value <> "“ 然后,在这个循环中,我需要一个I
浏览 16
提问于2020-08-17
得票数 0
6
回答
如何使用
pandas
查找
重复
名称?
、
、
我有一个包含名为name
的
列
的
pandas
.DataFrame,其中包含字符串。我想要获取在该列中多次出现
的
名称
的
列表。我该怎么做?
浏览 5
提问于2013-03-06
得票数 21
回答已采纳
2
回答
使用
pandas
在大于内存
的
数据集中获取
重复
行
、
、
、
非常适合在数据帧内
的
指定列中
查找
重复
的
行
。 但是,我
的
数据
集
大于内存容量(甚至大于在合理
的
预算限制内扩展后所能容纳
的
容量)。这对于我必须执行
的
大多数分析都很好,因为我可以循环我
的
数据
集
(csv和dbf文件),将每个文件单独加载到内存中,并按顺序执行所有操作。然而,对于
重复
分析,这显然不适合在整个数据集中
查找
重复
项</em
浏览 5
提问于2017-02-16
得票数 0
2
回答
如何在
pandas
数据帧中
查找
包含除NaN之外
的
所有唯一值
的
列名?
、
我想要
查找
包含
pandas
数据框中除NaN以外
的
所有非
重复
项
的
列。x y zb 2 2 Bd 4 NaN NaN列"x“和"z”
具有
除NaN之外
的
非
重复
值,因此我希望将它们挑选出来并创建一个新
的
数据框。
浏览 16
提问于2020-05-14
得票数 1
回答已采纳
1
回答
使用
Pandas
如何去复制以块形式读取
的
文件?
、
、
我有一个大
的
固定宽度
的
文件被读成块10000
行
熊猫。除了从数据中删除
重复
项
外,这对于所有东西都很有用,因为复制
项
显然可以在不同
的
块中。由于文件太大,无法全部装入内存,所以文件正在以块形式读取。我第一次尝试去复制文件
的
目的是只引入去
重复
文件所需
的
两列,并列出不读取
的
行列表。只阅读这两列(在大约500列中)很容易就可以在内存中使用,并且我能够使用id列
查找
重复
浏览 1
提问于2015-06-04
得票数 8
回答已采纳
1
回答
如何比较单个表中
的
两
行
我有带有像firstname, middlename, lastname, department, effectivedate, canceldate和processdate这样列
的
employee
的
暂存表为了
查找
重复
项
,我必须将每一
行
与其他行进行比较,如果两
行
匹配,则必须选择一个
具有
更大进程日期
的
行
。我使用带有Dense_rank函数
的
CTE来
查找
重复
项
浏览 2
提问于2011-09-16
得票数 1
1
回答
Pandas
dataframe:保留
具有
重复
项
的
行
、
、
、
这个问题比Remove duplicate rows in
pandas
dataframe based on condition稍微复杂一点 我现在有两个列'valu1',‘valu2’,而不是一个3 122015-10-31 5 13 在上面的数据框中,我希望通过在valu1列中保留
具有
较高值
的
行
,在value2列中保留较低值
的
行
,来删除
重复
浏览 95
提问于2019-04-20
得票数 3
回答已采纳
2
回答
在一列中
查找
重复
项
,而在另一列中
查找
非杜撰
项
。
、
如何获取数据
集
并输出结果,在一列中
查找
重复
信息,在另一列中
查找
非
重复
项
,这使我感到非常困难。如果列0和2是完全
重复
的
,我不关心数据
集
,只有当列0
的
条目在第2列中有多个值
的
情况下,我才会关心。如果是这样的话,我想要所有与列0匹配
的
行
。 我首先使用concat将数据
集
缩小到
具有
重复
项
的</
浏览 0
提问于2018-11-16
得票数 1
回答已采纳
1
回答
是否有一个版本
的
str_detect可以
查找
重复
项
?
、
我有一个数据
集
,其中包含多个包含标识符
的
列,并且我需要根据这些标识符来标识
重复
项
。我创建了一个新列,将所有标识符列粘贴在一起,但我不确定如何实际检测
重复
项
。当前数据
集
如下所示: id <- (1:10) record <- c("A | B", "A", "--C--", "B", "CD", "D", "ABCD",
浏览 9
提问于2020-10-10
得票数 1
1
回答
在
具有
不同行数
的
数据
集
上应用transform_lookup
、
、
我目前正在学习Altair
的
地图功能,在查看其中一个示例(https://altair-viz.github.io/gallery/airport_connections.html)时,我注意到数据
集
(airports.csv和flights Airport.csv)
具有
不同
的
行数。
浏览 9
提问于2020-10-11
得票数 2
回答已采纳
2
回答
删除R中
具有
重复
值
的
行
的
所有副本
我有一个数据
集
如下所示:A 12 SC 12 SE 11 S我想删除
具有
重复
位置和类型
的
行
。我尝试使用duplicated函数
查找
重复
行
,但不知道如何删除所有
具有
重复
值
的
行
。
浏览 5
提问于2016-02-19
得票数 2
回答已采纳
1
回答
在一张表中匹配/重新排列2组IDS
、
、
、
这4个字段
的
组合在文件中是唯一
的
。问题是,我正在尝试创建一个广泛
的
列表,其中包含与4个in中
的
任何一个关联
的
所有in,并且在其他
行
中存在
具有
额外in或空白
的
匹配
项
。我想创建一个在这些ID字段中
查找
匹配
项
的
数据
集
,并为每个附加
的
唯一值添加一列,以创建关联ID
的
完整列表。合并应删除任何ID
的
重复
<
浏览 1
提问于2018-03-23
得票数 0
1
回答
如何将set函数应用于特定列
的
所有
行
,该列
的
条目是
具有
重复
值
的
列表?
、
在我
的
pandas
数据框中,我有一个列,该列
的
每一
行
都是一个
具有
重复
值
的
列表。例如,一个有3
行
的
数据框:df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]})我想要删除
重复
项
。我
的
预期输出类似于[[1,2,3],[1,2],[1,2,3]]。如何应用set函数来删除每个列表中
的
<
浏览 13
提问于2020-08-03
得票数 0
回答已采纳
2
回答
如果两个文件
具有
相同
的
列值,则合并这些文件中
的
行
、
、
目前,我正在亚马逊
的
网站上搜寻一些数据。我遇到
的
问题是,我不能真正从同一个页面获得一个产品
的
所有数据。 我最终得到
的
是两个文件,它们
具有
相同
的
列标题,但列本身
的
数据不同。我以前几乎从来没有用过熊猫,除了一些小东西,所以我在这个领域
的
知识并不是很多。如果file2中
的
代码与file1中
的
代码相同,那么将file2中
的
数据粘贴到file1中(或者直接创建一个新文件)
的
最佳方法是什么?我
浏览 10
提问于2019-02-01
得票数 1
回答已采纳
1
回答
查找
具有
频繁
项
集
的
相应
行
、
、
我
的
数据
集
是一个邻接矩阵,可与客户购买信息相比较。=p)现在我对频繁
的
项目
集
很感兴趣,所以我用了一个先验
的
词:frequent_itemsets =apriori(df, min_support=0.1, use_colnames=True)现在我们看到
项
集
(D,B)出现在75%
的
数据集中。但是我实际上对这个项目<
浏览 4
提问于2020-07-03
得票数 1
回答已采纳
3
回答
Pandas
在一列中搜索在另一列中
具有
不同值
的
重复
行
、
我有一个
Pandas
dataframe df,我想要
查找
其列A
的
值相同,但列B
的
值不同
的
所有
行
,例如: ---|---|---我知道可以使用pd.concat(g for _, g in df.groupby('A') if len(g) > 1)来获取
具有
重复
A值
的
行
,但是如何添加第二个约束呢?
浏览 16
提问于2017-01-19
得票数 9
1
回答
使用索引+
行
匹配从数据中删除
重复
项
、
我有两个
pandas
DataFrames,我想将它们连接在一起,这样就可以去掉
重复
的
外部联接。我
的
问题是,.drop_duplicates()在
查找
重复
项
时忽略索引。如果索引是不同
的
,那么它就不应该是
重复
的
。如果
行
索引和列是
重复
的
,如何删除
重复
项
?我唯一能想到
的
就是使用df.to_dict(),然后创建一个新
浏览 3
提问于2012-05-27
得票数 0
回答已采纳
1
回答
Pandas
Dataframe丢弃记录及其副本
我希望删除基于列
的
pandas
Dataframe中
具有
重复
项
及其
重复
项
的
记录
浏览 18
提问于2019-11-14
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券