腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
为
Pandas
Dataframe
中
的
每个
重复
行
追
加值
/
索引
、
、
、
我有一个排序
的
Dataframe
,其中包含一些
重复
的
ids,我希望通过附加
索引
来使这些ids具有唯一性,因为它们出现在
重复
列表
中
。原始df: id val1 5263 234 4 441 1002 4344 6574-2 121
浏览 18
提问于2020-01-05
得票数 0
回答已采纳
1
回答
熊猫添加了两个具有部分重叠指数
的
数据?
、
、
、
Python/
Pandas
02-10-2017 09:00:00, 0, 2.23, -2.24... datetime是(格式
为
DatetimeIndex)
的
索引
。现在,
每个
dataframe
都有m个
索引
/
行
,并且
每个
dataframe
都会在另一个之后启动特定
的<
浏览 1
提问于2018-05-24
得票数 1
1
回答
为什么熊猫
的
dataframe
.index
中
没有
重复
的
东西?
、
、
、
我刚刚为大学写了一个程序,使用
pandas
来组织一些非结构化数据。我确实让它变得更难了,但我最终找到了一些有趣
的
东西。以下是(针对学校
的
积极评论)代码,这些代码几乎是不相关
的
,但为了完整起见,在这里import
pandas
as pd df.to_csv("new.csv", index=Fal
浏览 18
提问于2021-06-03
得票数 0
回答已采纳
1
回答
Python
Pandas
-根据给定
的
窗口并从特定值开始计算特定列
的
总和
、
我正在尝试在Python
Pandas
数据框
中
创建一个新列,其中包含指定范围内另一列
的
相
加值
,并从某一
行
开始。例如,在下面的数据框
中
,我希望跟踪1
的
值列
的
总和从第3
行
开始(使用
索引
行号)。但是,我还需要对跟踪2
重复
相同
的
标准。此外,我需要从
每个
跟踪
的
相同样本号开始。有什么想法吗?
浏览 7
提问于2018-07-29
得票数 0
回答已采纳
1
回答
添加两个不带排序
索引
的
数据帧
、
、
如何将2个数据帧
中
的
值按
索引
值(0表示缺失)相加,而不对
索引
进行排序。import
pandas
as pddf2=pd.
DataFrame
([4,5],['Yesfill_value=0)Maybe 2.0Yes
浏览 11
提问于2021-02-03
得票数 0
回答已采纳
3
回答
熊猫-在新
的
dataframe
列
中
增加特定iloc
的
价值
、
、
我有一个包含很多列
的
大数据。 对于
dataframe
中
的
每一
行
/
索引
,我都会执行一些操作,读取一些附加
的
ata,等等,并获得一个新
的
值。是否有方法将新值添加到正确
的
行
/
索引
的
新列
中
?我可以使用.assign添加一个新列,但由于我正在遍历
行
,而且每次只生成一个值要添加
的
数据(生成数据非常复杂)。当生成它时,我想
浏览 5
提问于2017-09-08
得票数 59
回答已采纳
6
回答
如何使用
pandas
查找
重复
名称?
、
、
我有一个包含名为name
的
列
的
pandas
.
DataFrame
,其中包含字符串。我想要获取在该列
中
多次出现
的
名称
的
列表。我该怎么做?
浏览 5
提问于2013-03-06
得票数 21
回答已采纳
3
回答
群
Pandas
DataFrame
重复
行
,保留最后
的
索引
、
、
我有一个
Pandas
DataFrame
,它有一个有意义
的
索引
和各种
重复
行
组。假设它看起来像这样: >>> df = pd.
DataFrame
([[1, 1, 1], [2, 3, 4], [2, 3, 4], [1, 1, 1](除了
每个
重复
批处理
中
的
第一个
行
),但是将最后一<
浏览 10
提问于2021-10-26
得票数 0
2
回答
作为
DataFrame
列
的
Scipy稀疏矩阵
、
、
、
、
我正在开发基于
pandas
DataFrame
对象
的
工具。我希望将scipy稀疏矩阵保留
为
DataFrame
的
列,而不是将其按
行
转换为dtype('O')
的
列表/数值数组。下面的代码片段不起作用,因为
pandas
将矩阵视为标量,并建议添加
索引
。当在矩阵
中
的
行
索引
上提供pd.RangeIndex时,矩阵将对数据帧<em
浏览 12
提问于2016-09-12
得票数 4
回答已采纳
2
回答
附加和处理
重复
、
我有一个带有timeseries数据
的
df。现在,我想添加更多
的
数据,通过使用
DataFrame
.append()来实现。将附加
的
数据包含新列和
重复
值。因此,我通过在追加后删除
重复
的
值来清理。有更好
的
办法吗?2021-02-11 17.089 16.316 15.733 15.630 2021-02-10 17.425 16.525 15.
浏览 2
提问于2021-02-16
得票数 0
1
回答
如何在使用drop_duplicates (
Pandas
DataFrame
)时获得掉
行
?
、
、
、
我使用
pandas
.
DataFrame
.drop_duplicates()删除所有列值相同
的
行
的
重复
项,但是对于数据质量分析,我需要生成一个带有删除
的
重复
行
的
DataFrame
。如何识别要删除
的
行
?我想到了比较原始
的
DF和没有
重复
的
新
的
DF,并识别缺少
的
唯一
索引</e
浏览 10
提问于2020-07-06
得票数 1
回答已采纳
1
回答
Pandas
:一列除以另一列得到两列NaN
、
、
我计算两列
的
差值,如下所示: (pd.
DataFrame
(pd.
DataFrame
(clf.get_best_score())["validation"] - pd.
DataFrame
(clf.get_best_score(pd.
DataFrame
(clf.get_best_score())["validation"] - pd.
DataFrame
(clf.get_best_score())["learn"])) /
浏览 49
提问于2021-01-28
得票数 1
回答已采纳
4
回答
如何在列表
中
查找公共元素
、
、
我有一个列表l1,看起来像1,2,1,0,1,1,0,3...我希望
为
每个
元素找到与该元素具有相同值
的
元素
的
索引
。例如,对于列表
中
的
第一个值1,它应该列出列表
中
存在1
的
所有
索引
,并且应该对列表
中
的
每个
元素
重复
相同
的
索引
。我可以编写一个函数来迭代列表,但是我想检查是否有任何预定义
的
函数。我正在从
浏览 4
提问于2016-11-03
得票数 0
4
回答
pandas
中
的
多列分解
、
、
、
pandas
factorize函数将序列
中
的
每个
唯一值分配给一个从0开始
的
顺序
索引
,并计算
每个
序列条目所属
的
索引
。我想在多个列上实现
pandas
.factorize
的
等价物:df = pd.
DataFrame
({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2,
浏览 0
提问于2013-05-09
得票数 12
回答已采纳
2
回答
将Python数据帧转换为带
索引
的
字典
、
、
我正在尝试将
dataframe
转换为字典(因为它们在过滤key时速度更快),我目前正在使用 t3 = time()for i in df.index.unique(): r[i].append(df.loc[i].values) print(round((time()-t3), 1), "s") 这种类型
的
转换速度很慢。我希望数据帧
的
索引
作为键,
行
作为在单个键上具有多个值
的
值
浏览 19
提问于2020-08-22
得票数 0
回答已采纳
2
回答
熊猫:基于
重复
指标值加速df.loc
、
、
、
我有熊猫
DataFrame
import numpy as np 'x': ['a', 'b', 'c'],'y': [1, 2, 2],}).set_index('x') 其中,我希望根据选择数组<em
浏览 3
提问于2015-10-26
得票数 6
回答已采纳
3
回答
熊猫在第一列合并
、
、
我正在尝试合并两个
pandas
数据帧,它们在我试图合并
的
条目中有
重复
的
行
(这里是由对应于'a‘和’b‘
的
2组成
的
行
)。因此,
pandas
采用
重复
行
的
笛卡尔乘积,如下所示: In [8]: df1 = pd.
DataFrame
({'a' : [1, 2, 2], 'b' : [2, 2, 2], 'c
浏览 8
提问于2019-03-11
得票数 1
1
回答
通过在
Pandas
中
的
另一列
中
添加新值来扩展时间
索引
。
、
、
、
假设我在
Pandas
中有以下数据:df = pd.
DataFrame
(data=np.random.rand(11), index=index , columns=['rand'])07-01 0.7941642017-
浏览 4
提问于2017-07-27
得票数 2
回答已采纳
1
回答
按顺序标注
索引
以复制
DataFrame
索引
、
我有一个这样
的
DataFrame
:1 1002 300 01 0 1002 0 300 也就是说,我希望二级
索引
(在这里称为i2)
为
零,其中df.duplicated()
为
False (意味着<
浏览 3
提问于2017-07-31
得票数 2
回答已采纳
1
回答
使用
pandas
标识指定列
中
具有
重复
值
的
记录
、
、
我是Python和
Pandas
的
新手。我正在清理一个包含50,000个设备(50,000
行
和10列)
的
数据文件。每条记录
的
一列('UNITNUMBER')应该是唯一
的
。但是,也有副本,我正在尝试生成两个数据帧:一个包含UNITNUMBER唯一
的
所有记录,另一个包含UNITNUMBER在另一条记录
中
重复
的
所有记录。,顺序与原始
DataFrame
相同,
索引
为UNIT
浏览 9
提问于2017-07-18
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券