腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从
基于
文件
的
列
和
行
-
pandas
的
最大值
中
删除
重复
项
python
、
python-3.x
、
pandas
、
dataframe
2b kl ilp kjh 2020 1df['E'] = pd.to_datetime(df['E'], unit='ms').d
浏览 35
提问于2021-08-18
得票数 1
回答已采纳
1
回答
仅根据某些
列
选择唯一
行
sql
、
sql-server
我有一个SQL视图,我希望只
基于
某些
列
获得唯一
的
行
。 如果所有其他
列
都相同(不包括A),则必须
删除
重复
项
。如果所有其他
列
(B除外)相同,则必须
删除
重复
项
。我使用了下面的代码,但它仍然给出了A
的
最大值
,然后给出了B
的
最大值
,我想要得到不同
的
行
,不包括这两
列
,我
浏览 2
提问于2022-03-02
得票数 0
3
回答
根据
列
的
最大值
在Excel中有条件地去重
excel
、
duplicates
、
filtering
、
conditional-statements
但是,我希望
删除
此数据集中
的
行
,这样,最后,对于第二
列
中
的
每个唯一字,只保留
列
一
中
的
值是该字
的
最大值
的
一
行
,甚至
删除
那些具有每个唯一字
的
最大值
的
重复
的
行
,并为每个唯一字保留一
行
。: A-Z),然后按
列
1排
浏览 2
提问于2015-04-20
得票数 2
回答已采纳
1
回答
在Python
中
操作CSV
文件
python
、
file
、
parsing
、
csv
0] not in Names: Names.add(row[0]) 我正在使用Python2.7(Windows)使用此代码
从
CSV
文件
中
删除
重复
项
。我可以一次
删除
基于
一个
列
的
重复
项
。有没有什么方法可以同时
从
多个
列
中
删除
重复</
浏览 1
提问于2015-11-17
得票数 0
3
回答
根据两
列
A、B
从
数据帧
中
删除
重复
项
,将具有
最大值
的
行
保留在另一
列
C
中
python
、
pandas
、
dataframe
、
duplicates
我有一个
pandas
dataframe,它根据两
列
(A
和
B)包含
重复
的
值:1 2 12 7 13 4 8 我希望
删除
重复
项
,并将
最大值
行
保留在
列
C
中
。
浏览 162
提问于2015-08-19
得票数 75
回答已采纳
1
回答
Spark
删除
重复
项
并选择具有
最大值
的
行
apache-spark
、
apache-spark-sql
、
apache-spark-dataset
我正在尝试
删除
基于
column1
的
重复
项
,并选择column2
中
具有
最大值
的
行
。column2
的
值为"year"(2019,2020等),类型为"String“。我
的
解决方案是,将第2
列
转换为整数,并选择
最大值
。 Dataset<Row> ds ; //The dataset with column1,
浏览 0
提问于2020-11-18
得票数 0
1
回答
Pandas
Dataframe丢弃记录及其副本
python-3.x
我希望
删除
基于
列
的
pandas
Dataframe
中
具有
重复
项
及其
重复
项
的
记录
浏览 18
提问于2019-11-14
得票数 0
回答已采纳
2
回答
在Unix
中
合并两个
文件
时,
删除
重复
项
并取其他记录
的
最大值
unix
、
awk
我有两个
文件
a.txt
和
b.txt,每个
文件
有6
列
。我想合并这两个
文件
,并
删除
基于
所有6
列
的
精确
重复
项
,而对于其他情况,我希望
基于
第1
列
和
第2
列
的
分组,将第3
列
、第4
列
、第5
列
、第6
列
作为
最大值
。我想通过以下示例来解释这一
浏览 1
提问于2020-07-14
得票数 0
1
回答
仅取R
中
数据框所有
列
的
重复
in
的
最大值
r
、
dplyr
、
data.table
、
tidyr
我有24525
行
22
列
的
数据帧。最后一
列
是ID
列
,其他
列
是数字
列
。唯一ID数为18414,部分ID
重复
次数超过2次。 我需要
删除
重复
的
ID,并且只保留另一个数据框
中
每个ID
和
每
列
的
最大值
。我尝试在for循环中对每一
列
进行排序,并
删除
重复
项
以
浏览 0
提问于2021-01-13
得票数 0
1
回答
使用
Pandas
如何去复制以块形式读取
的
文件
?
python
、
pandas
、
chunking
我有一个大
的
固定宽度
的
文件
被读成块10000
行
熊猫。除了
从
数据
中
删除
重复
项
外,这对于所有东西都很有用,因为复制
项
显然可以在不同
的
块
中
。由于
文件
太大,无法全部装入内存,所以
文件
正在以块形式读取。我第一次尝试去复制
文件
的
目的是只引入去
重复
文件
所需
的
两
列<
浏览 1
提问于2015-06-04
得票数 8
回答已采纳
1
回答
excel只显示具有不同值
的
行
。
excel
、
diff
我有一个带有集合字段集
的
“主”表(它是我每次提取
的
同一字段集)。C1 B 1 BA由于B:2已从2改为1,应导致: A B C1 B 2 BA 我想得到我
的
“主”表和数据
的
“下一次提取”之间
的
更改。挑战(我认为)是,我只希望在第三个工作表
中
显示有更改
的
行
。
浏览 2
提问于2016-06-30
得票数 0
回答已采纳
1
回答
如何
基于
多个动态
列
删除
重复
项
bash
、
shell-script
、
awk
使用bash(awk),如何根据多
列
从
管道分隔
的
文件
中
删除
重复
项
,但需要将列作为输入参数传递。我在
文件
中有下面的数据Insert|val1a|val2|val3a|val4 我想要
删除
基于
输入参数
的
重复
项
。有时,我希望使用位置1
和
位置3
删除
行</
浏览 0
提问于2022-03-28
得票数 0
回答已采纳
1
回答
如何
删除
部分列上有
重复
值
的
行
?
python
、
pandas
我正在创建将xlsx
文件
读取到
pandas
dataframe并向其添加新
行
的
脚本。然而,我
的
问题是,我不想添加在前四
列
(总共包含5
列
)
中
具有相同值
的
重复
项
。第五个
列
值可以是任何值,但是
基于
这四
列
上
的
重复
项
,我想
删除
整行。 除此之外,我
的
代码是全功能
浏览 26
提问于2019-07-31
得票数 0
回答已采纳
1
回答
如何合并
重复
项
并从其他
列
获取min/max值?
python
、
r
、
bash
我希望在一
列
中
合并
重复
项
,并从其他两
列
中
获取最小/
最大值
:例如,
从
该
文件
中
:100627109.00 100637104.0027612292.00 27626240.00 y27612669.00 27626569.00 y
浏览 4
提问于2022-07-15
得票数 -3
回答已采纳
2
回答
如何使用带管道值
的
awk
从
管道分隔
的
文件
中
删除
重复
项
?
shell-script
、
awk
、
escape-characters
我正在尝试使用此如何
基于
多个动态
列
删除
重复
项
从
管道分隔
的
文件
中
删除
基于
多
列
的
重复
项
,但是我发现在值中有一些管道在双引号
中
,如下所示3|XX|"2025035|6|15|0|0
浏览 0
提问于2022-04-06
得票数 1
回答已采纳
1
回答
在特定列上添加来自其他数据帧
的
列
,同时保留原始索引
pandas
、
dataframe
、
join
、
merge
、
concatenation
Pandas
新手入门,并尝试
基于
两个数据帧共有的
列
从
df2向df1添加
列
。我想保留df1
中
的
索引。注意,df2有很多
重复
的
行
,包括
重复
的
ItemIds。0 1 apple2 7 monster我想保留DataFrame 1
的
索引,并将Da
浏览 9
提问于2019-07-09
得票数 0
回答已采纳
1
回答
excel:按3
列
检查
重复
行
,保留一
行
excel
、
vba
这可能是一个有点多
的
要求,但我想知道以下是否可能。这都是
基于
我在上
的
初始问题 我有一个工作表,其中包含大约12
列
相同类型
的
数据被复制到其中,这意味着两
行
或更多行可能包含完全相同
的
数据,但是如果我可以检查
重复
,它将
基于
3个特定
的
列
。我不想对此任务使用AutoFilter或条件格式,因为工作表可能包含数百到数千
行
,而我希望能够找到
重复
项
,
删除
浏览 0
提问于2014-02-09
得票数 2
回答已采纳
1
回答
Python -为接近
重复
的
行
保留新
列
中
的
不同值,然后
删除
重复
行
python
、
pandas
、
dataframe
、
duplicates
我有一个
pandas
dataframe,它是查询
的
结果,其中1
列
创建
重复
的
行
。我需要帮助通过名称识别
重复
项
的
非
重复
值,然后动态创建包含所有值
的
新
列
,然后
删除
重复
项
。下面的Mike在
列
"Code“中有
重复
项
,Mark在"Lang”
列
中有<
浏览 0
提问于2020-02-25
得票数 1
1
回答
有条件地
删除
重复
的
pandas
python
python
、
python-2.7
、
numpy
、
pandas
、
dataframe
有没有办法有条件地在大约10
列
和
400,000
行
的
pandas
数据框
中
删除
重复
项
(特别是使用drop_duplicates )?也就是说,我希望所有有2
列
的
行都满足一个条件:如果date (column)
和
store (column) #
的
组合是唯一
的
,则保留
行
,否则
删除
。
浏览 1
提问于2015-05-03
得票数 8
2
回答
在
pandas
数据框中选择唯一
的
观测值
python
、
pandas
我有一个包含uniqueid
列
的
pandas
数据框。我想从
基于
此列
的
数据框
中
删除
所有
重复
项
,以便所有剩余
的
观测值都是唯一
的
。
浏览 0
提问于2013-11-01
得票数 7
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
肝了3天,整理了90个Pandas案例
pandas系列学习(三):DataFrame
Pandas实现分列功能
每天读一本:利用Python进行数据分析
pandas 入门 1:数据集的创建和绘制
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券