腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
创建
一个
新
的
df
,
保留
1个
重复
的
日期
时间
,
但
保留
pandas
df
上
其他
副本
的
行
值
python
、
pandas
我有
一个
这样
的
DF
Date A B C2021-01-0122:00:00 false true false 2021-01-01 22:00:00 false false true 我需要
创建
一个
没有
重复
值
的
新
df
,
但
保留
浏览 5
提问于2021-10-22
得票数 0
2
回答
根据条件删除不同
的
值
r
、
dplyr
我有
一个
数据集,我试图删除
重复
的
值
,
但
需要
保留
符合条件
的
行
。看上去,a NAb 1d 1如果只运行正常
的
不同函数,则只
保留
重复
项
的
第
一个
值
/
行
。col1 col2b 1d 1 但是-我需
浏览 8
提问于2022-07-22
得票数 1
回答已采纳
2
回答
如何使用dropDuplicates()获得最后
一个
值
?
apache-spark
、
pyspark
假设我有以下星星之火数据格式(
df
):可以看到,“
时间
戳”列中有
重复
的
值
,我想去掉它们,留下‘
时间
戳’具有唯一
值
的
行
。我试图用这一
行
代码删除
副本
:dropDuplicates()似乎
保留
了
重复
行
中
的
第一
行
浏览 0
提问于2019-05-10
得票数 1
回答已采纳
1
回答
如何避免
创建
中间数据框架?
python
、
pandas
、
dataframe
、
concat
我使用
的
数据集需要识别多个
重复
行
之间
的
最大
日期
差异。下面的代码可以满足我
的
要求(减去"A
值
试图设置在来自dataframe
的
一个
片段
的
副本
上
“警告),但是我很好奇如何执行相同
的
任务,而不必
创建
一个
新
的
中间数据。(subset=['Key','Num1
浏览 0
提问于2018-02-18
得票数 2
回答已采纳
4
回答
R删除除第一次出现外
的
所有
r
、
sorting
、
dataframe
、
subset
-12-15 08:30
df
<- data.frame(id=c(1,2,3,1),我目前所做
的
方式是按date进行排序,然后:
df</em
浏览 16
提问于2017-07-11
得票数 0
回答已采纳
2
回答
Python
Pandas
Dataframe根据列
值
移除
重复
行
python
、
pandas
我有
一个
pandas
dataframe,如果LE列是"AAA“,我会尝试删除
重复
的
行
。如果有
一个
"AAA“,
但
没有
其他
行
具有相同
的
ID/名称,那么我想不去管这些
行
。我所拥有的
df
= pd.DataFrame({'ID': [111, 222, 222, 333, 33
浏览 3
提问于2020-08-20
得票数 1
1
回答
从csv文件中删除部分
重复
项
python
、
pandas
、
duplicates
我有
一个
csv文件,大约1800
行
。该文件包含多个
副本
,我希望在只
保留
一条原始行
的
同时处理这些
副本
。例如: 我们加入抗议#抗议#加入We加入抗议#victory#letsrock我们加入抗议!!我想在
保留
前两
行
的
同时去掉最后两
行
。我决定使用uses来完成这个任务(它使用了difflib)。但是,它只删除一些相关
的
行
或删除一些
重复
的
行</e
浏览 1
提问于2022-04-04
得票数 0
3
回答
如何删除
pandas
数据帧中
的
重复
项,
但
保留
基于特定列
值
的
行
python
、
pandas
、
dataframe
、
duplicates
、
drop
我有
一个
有NBA球员统计数据
的
pandas
数据框,我想删除
重复
的
球员
行
。有
重复
的
,因为有些球员在2020-2021赛季在多支球队踢球,我想删除这些
重复
的
东西。然而,对于这些在多个球队踢球
的
球员,还会有
一个
行
,其中包含该球员在所有球队
的
组合统计数据和团队标签'TOT',这表示该球员在本赛季在两支或更多球队比赛
的
浏览 1
提问于2021-02-02
得票数 0
9
回答
放置
副本
并保持第一位
dataframe
、
apache-spark
、
pyspark
、
apache-spark-sql
、
duplicates
问题:在熊猫中,当你丢弃
重复
的
时候,你可以指定要
保留
哪些列。“星火数据”中有类似的吗?熊猫:(我使用Spark1.6.0)没有
保留
选项
df
.ord
浏览 21
提问于2016-07-31
得票数 55
1
回答
根据另一列
的
条件删除列中具有
重复
值
的
行
- Python/
Pandas
python
、
pandas
、
duplicates
我将CSV文件中
的
数据读入
Pandas
dataframe (所有单元格都具有字符串类型,NaN:s已被替换为“已经”),有一些需要删除
的
重复
值
。Col2
值
为"“
的
行
。= "") | ~my_
df
["Col1"].duplicated()] 它用Col1中
的
重复
项移除一些但不是所有想要
的
行
。如果这样
的</e
浏览 2
提问于2022-11-03
得票数 1
回答已采纳
1
回答
删除特定栏熊猫
python
、
pandas
这些文件都有相同
的
行
,列名不同,
但
第一
行
的
代码相同。例如,csv文件,
一个
将有J1_01,J1_02,J2_01,J2_02.....,然后它将
重复
与
其他
合并
的
csv文件J1_01,J1_02,J2_01,J2_02,J3_01....所有的csv文件将有不同
的
列。第二
行
提供列
值
的
标题描述。每个csv文件有三个列,它们描述
行
的
名
浏览 0
提问于2019-03-26
得票数 1
回答已采纳
2
回答
如果另一列中
的
值
为null -
Pandas
,则删除
重复
。
python
、
pandas
、
drop-duplicates
我所拥有的:Name |Vehicle Mark |BikeDave |我想从Name列中删除
重复
项,
但
只有在Vehicle列中
的
相应
值
为null时才
行
。我知道我可以用对于任何
一个
Keep =,或者'First' or 'Last',但是我要寻找<em
浏览 4
提问于2019-12-30
得票数 5
回答已采纳
2
回答
如何删除
重复
项,并仅在第一
行
相邻时
保留
第一
行
python
、
pandas
、
dataframe
问题代码示例 example_
df
= pd.DataFrame({'name':['John','
浏览 0
提问于2021-01-07
得票数 0
回答已采纳
2
回答
大熊猫按条件分类/脱模
python
、
pandas
我有
一个
带复制件
的
DataFrame。我想用groupby和条件删除
副本
。import
pandas
as pd 'id': [0, 1, 2, 3, 4, 5],'Dt': ['2019-03-01', '2020-09-30', np.nan, '2021-09-30', '2022-
浏览 5
提问于2022-06-28
得票数 0
回答已采纳
1
回答
熊猫:如何删除
重复
但
保留
某些
行
值
的
列
值
python
、
pandas
、
dataframe
我有
一个
Pandas
dataframe,它有
重复
的
名称,但是有不同
的
值
,我想删除
重复
的
名称,但是
保留
行
。我
的
dataframe片段如下所示: 我想要
的
输出应该如下所示:我尝试使用内置
的
熊猫函数.drop_duplicates(),
但
最后删除了所有的
重复
项及其各自
的
行
。(<e
浏览 8
提问于2022-09-11
得票数 0
1
回答
基于列和
行
的
Pandas
条件输出到bool (替换`for`语句)
python
、
pandas
我正在尝试基于编码在多列中
的
信息以及索引
的
相对位置
创建
一个
新
列(bool)。 我有
一个
包含start和end列以及多个
行
的
DataFrame。我希望
保留
不与
其他
行
重叠
的
行
,优先于最高
的
行
/第
一个
观察
值
(
DF
排序)。这种for循环方法删除了列(最终我要做
的</
浏览 2
提问于2020-02-21
得票数 0
2
回答
分享约会
时间
,巨蟒,熊猫
python
、
pandas
、
datetime
、
time-series
对不起,我刚开始问关于堆叠溢出
的
问题,所以我不明白如何正确地设置格式。我试过:
df
=
浏览 0
提问于2018-04-06
得票数 2
回答已采纳
4
回答
熊猫
python
、
pandas
、
drop-duplicates
我熟悉如何删除
重复
行
,然后使用first、last、none参数。这并没有太复杂,而且有很多例子(如)。但是,我正在寻找
的
是找到
副本
的
方法,但是与其删除所有
副本
并
保留
第
一个
副本
,如果我有
副本
,
保留
所有
重复
项,
但
删除第
一个
副本
: 因此,我要
的
不是“如果
重复
,
保留
第
一个<
浏览 0
提问于2019-03-12
得票数 6
回答已采纳
1
回答
巨蟒大熊猫如何有选择地丢弃复制
python
、
pandas
、
dataframe
我需要查看列'b‘中
的
所有
行
,如果该行不是空
的
,则转到另
一个
相应
的
列'c’,并对第三列'c‘中
的
所有
其他
行
删除此特定索引
的
重复
项,同时
保留
该特定索引。因此,可能
的
情况是:如果在“b”中找到
一个
非空
值
,则可以转到“c”中的当前索引,并找到该索引
的
所有
副本
并删除这些索引。这些
重
浏览 6
提问于2016-09-22
得票数 1
回答已采纳
3
回答
如何有条件地仅映射列
的
空行?
python
、
pandas
如何
创建
映射到字典
的
新
dataframe列,
但
只针对空行,同时
保留
非空行
的
引用列
的
值
?下面我通过将'col1‘映射到x来
创建
'new col’,但我希望仅在' col2‘为空
的
地方映射到x,否则使用col2中
的
值
。import
pandas
as pd x = {'three':'green',
浏览 0
提问于2018-09-19
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
这几个方法颠覆你对Pandas缓慢的观念!
还在抱怨pandas运行速度慢?这几个方法会颠覆你的看法
数据挖掘与建模之数据预处理
盘点一个Pandas处理Excel表格实战问题(上篇)
Pandas中比较好用的几个方法
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券