腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
对
pandas
DataFrame
中
的
重复
项
进行
平均
化
,
而
不是
使用
drop_duplicates
保留
第一项
、
、
、
假设我有一个表单
的
Pandas
DataFrame
: id price dur2 153 130.00.09 158 105.0 0.0 10 158 155.0 0.0 我有一个名为id
的
列我希望通过
保留
unique id,然后执行id
的
price
平均
值来处理此i
浏览 30
提问于2020-04-14
得票数 0
1
回答
熊猫:如何对数据
中
至少出现n次
重复
项目的数据
进行
筛选
、
、
、
我有一个包含
重复
条目的
Pandas
DataFrame
;有些条目被列出了两次或三次。我想
对
它
进行
筛选,以便它只显示至少n倍列出
的
项
。 最终结果应该只列出每一
项
。
浏览 4
提问于2015-10-03
得票数 15
回答已采纳
3
回答
根据两列A、B从数据帧
中
删除
重复
项
,将具有最大值
的
行
保留
在另一列C
中
、
、
、
我有一个
pandas
dataframe
,它根据两列(A和B)包含
重复
的
值:1 2 12 7 13 4 8 我希望删除
重复
项
,并将最大值行
保留
在列C
中
。我是
不是
应该用
drop_duplicates
()或者别的什么?
浏览 162
提问于2015-08-19
得票数 75
回答已采纳
3
回答
如何删除
pandas
数据框
中
列值
重复
的
行?
、
Column31 dog 1 A我希望确定cat和bat是
重复
的
相同值,因此希望删除一条记录并只
保留
第一条记录。得到
的
数据框应该只有。0 cat 1 C 1 dog 1 A
浏览 0
提问于2018-06-16
得票数 31
回答已采纳
4
回答
熊猫把副本放在清单上
、
、
说我
的
数据是:产生
的
结果:0 [1, 0]2 [1,0]df.drop_duplicates()df
浏览 0
提问于2018-05-18
得票数 14
回答已采纳
2
回答
如何根据其他列
中
的
一个条件和两个条件删除
重复
项
?
、
、
、
我正在尝试根据
Dataframe
中
的
两列删除
重复
的
"Box“行:import
pandas
as pd d = {'Box': ['A1', 'A1', 'A2', 'A3', 'A4',Ready', 'Prep', 'Ready'], 'Week':[11, 12, 12,
浏览 4
提问于2019-06-03
得票数 1
回答已采纳
3
回答
Python(
pandas
):基于两列删除
重复
项
,将行与标志
保留
在另一列
中
、
python
pandas
的
新手,需要删除
重复
的
索引行,并根据一列
的
标志在
重复
行
中
只
保留
一行,示例如下: Index value 1 value2 flag2 32 42 off3 33 43 off 根据index和flag cloumn
进行
过滤后value 1 value2 fla
浏览 70
提问于2019-05-18
得票数 0
3
回答
熊猫不移除
重复
、
在以下脚本
中
df_dict = {"A": [1,2,3,3,4], "B": [1,2,2,3,4]} start() d
浏览 5
提问于2020-08-03
得票数 2
回答已采纳
1
回答
巨蟒大熊猫如何有选择地丢弃复制
、
、
我需要查看列'b‘
中
的
所有行,如果该行
不是
空
的
,则转到另一个相应
的
列'c’,并
对
第三列'c‘
中
的
所有其他行删除此特定索引
的
重复
项
,同时
保留
该特定索引。我遇到了
drop_duplicates
,但是我无法找到只查找突出显示
的
行
的
副本
的
方法,
而
不是
一列
浏览 6
提问于2016-09-22
得票数 1
回答已采纳
1
回答
如何在
pandas
中
读取和取多个表文件
的
平均
值?
、
这就是两个表
的
样子我知道我可以读懂它们,并可以
使用
以下命令取它们
的
平均
值names=['wave','num',
浏览 0
提问于2018-08-01
得票数 1
1
回答
Dask
Dataframe
:按A列删除
重复
项
,
保留
B列中值最高
的
行
、
、
基本上,这是
对
熊猫在
的
答案。在熊猫里,我采用了这个解决方案但我无法有效地将相同
的
解决方案应用于df.loc[max_idx.compute()] 在整个dask框架上,方法df.nlargest(1, "B")可以满足我
的
需要,但我还没有想出如何
使用
groupby来满足我
的</e
浏览 1
提问于2021-06-17
得票数 0
回答已采纳
3
回答
如何合并大数据帧和小数据帧?
、
、
我有一个有100行
的
大型数据帧,结构是qtr_dates<datetime.date>,sales<float>,还有一个结构相同
的
小数据帧,少于100行。我想合并这两个df,这样合并
的
df将拥有来自小df
的
所有行,而其余
的
行将从大df
中
获取。现在我正在做这个 df = big_df.merge(small_df, on=big_df.columns.tolist(), how='outer') 但这是在创建具有
重复
qtr_d
浏览 18
提问于2021-10-07
得票数 0
回答已采纳
3
回答
Pandas
/Python:如何在不
重复
的
情况下连接两个数据帧?
、
、
我想将两个数据帧A,B连接到一个没有
重复
行
的
新数据帧
中
(如果B
中
的
行已经存在于A
中
,则不添加): I II I II 0 1 2 5
浏览 1
提问于2014-01-24
得票数 81
回答已采纳
1
回答
熊猫如何找到一
对
一
的
相关值?
、
我有I
对
的
df,并且我尝试过滤那些具有唯一一
对
一关系
的
对
,以便没有left_id值具有来自right_id
的
多个对应值,同时,没有right_id值具有来自left_id
的
多个对应值。让我们生成一些示例数据用于说明: np.random.seed(0) df = pd.
DataFrame
(data = np.random.randint(0,1000,(1000000,2)),right_id']) 就像这样: left_id right
浏览 5
提问于2020-01-05
得票数 0
回答已采纳
1
回答
数组:将稀疏数组合并为一个人口更密集
的
数组。
、
我有下面的表格,它是稀疏
的
,但也有
重复
的
列。| A | || A | X |
使用
df[["LX ID", "ISIN"]].
drop_duplicates
()生成下面的内容,去掉相同
的
行,但在列
中
仍然存在
重复
(例如,最后3列): +--------
浏览 0
提问于2017-02-03
得票数 1
回答已采纳
2
回答
Python合并两个csv文件python
、
应该将file2.csv与文件file1.csv合并,如果有一些更改要替换为file1.csv
中
的
数据,以保存file2.csv
中
的
数据 Frame_Nr; Data110 0 0 0 12 1 1 1 我
的
代码
浏览 1
提问于2019-11-22
得票数 1
回答已采纳
1
回答
dataset.drop_duplicates()给出ValueError:传递
的
项数错误,但示例(frac=1)没有
、
我有一个名为work3
的
数据集,我试图根据'clean_name‘列删除
重复
的
行。下面是关于work3
的
信息:输出:Int64Index: 3295520 entries, 0clean_name'])ValueError: Wrong number of items passed 2117463, placement i
浏览 1
提问于2017-10-13
得票数 1
回答已采纳
2
回答
删除大熊猫
中
的
所有行,在一列中有相同
的
值,在另一列中有不同
的
值。
、
假设我有以下类型
的
dataframe
:0 123 a2 123 a4 345 a6 456 d8 678 e对于col1
中
的
特定
重复
值,所有对应
的
col2值都应该完全相同。如果对应
的
col2值中有一个不同,则删除该col1值
的
所有实例。因此,在
浏览 0
提问于2019-05-14
得票数 2
回答已采纳
1
回答
dask df.col.unique() vs df.col.drop_duplicates()
在“达斯克”
中
,和两者都返回一个包含df.col
的
唯一元素
的
系列。索引存在差异,unique结果被索引为1.N,
而
drop_duplicates
则由任意看上去
的
数字序列索引。
drop_duplicates
返回
的
索引
的
意义是什么?如果索引不重要,是否有理由
使用
其中一种
而
另一种?
浏览 4
提问于2016-03-07
得票数 8
回答已采纳
1
回答
drop_duplicates
- TypeError:在*后面键入对象参数必须是序列,
而
不是
映射
、
、
我已更新我
的
问题,以提供一个更清楚
的
例子。 是否可以
使用
Pandas
中
的
drop_duplicates
方法根据列id删除
重复
行,其中
的
值包含一个列表。考虑一下“三”列,它由列表
中
的
两
项
组成。是否有一种方法可以删除
重复
的
行,
而
不是
迭代执行(这是我当前
的
解决办法)。我列举了以下例子,概述了我<em
浏览 3
提问于2016-06-13
得票数 14
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
MySQL、Python中数据去重的操作方法
pandas系列学习(五):数据连接
肝了3天,整理了90个Pandas案例
每天读一本:利用Python进行数据分析
机器学习之计算工具库(三)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券