腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
标记
所有
重复
项
-
Pandas
Dataframe
-
即使
在
输出
中
没有
'
NaN
'
s
的
第一个
实例
也是
如此
python
、
pandas
、
dataframe
、
duplicates
(employees, columns = ['Name', 'Age', 'City']) 我想找出城市形式
的
重复
项
,并将值存储
在
dataframe
本身
中
。32 Mumbai True7 Link 32 London False 但是,我希望**
中
的
duplname
也是
真
浏览 29
提问于2021-08-13
得票数 1
回答已采纳
1
回答
熊猫数据融合而不复制任何一方?
python
、
pandas
、
dataframe
、
merge
、
duplicates
我经常从不同
的
来源得到包含类似信息
的
表格,用于"QC“。有时我想把这两个表并排放在一起,
输出
到excel来显示别人,这样我们就可以解决不一致了。要做到这一点,我想要一个‘懒惰’与熊猫
的
数据融合。1 22 b 5 6 5 64 c 9 9 3 a 3 4 0.0 0.0 4 b 5 6
浏览 3
提问于2017-10-26
得票数 1
回答已采纳
1
回答
基于列
的
最大值
的
Python丢弃列
python
、
numpy
、
pandas
我刚开始使用
Pandas
作为处理二维数据数组
的
工具。
即使
在看过文档之后
也是
如此
。你可以做很多事情,我想不出怎么做,如果这有任何意义的话。我
的
数据(简化):2014.10.10 74.75
NaN
NaN
2014.9.9
NaN
100.95我希望删除最大值小于x
的
所有
列。因此,举个例子,如果x= 80,
浏览 2
提问于2014-11-12
得票数 11
回答已采纳
1
回答
当有两个参数时,删除powershell
中
的
重复
项
powershell
、
duplicates
99.39 Tampa 92.85 Tarrace 99.39 Tampa 只有
在
输出
中
需要单个参数时
浏览 2
提问于2020-08-12
得票数 0
回答已采纳
1
回答
与文件不同
的
熊猫
python
、
pandas
、
dataframe
、
append
、
concatenation
我
在
使用熊猫
dataframe
.append()时遇到了麻烦,因为它
的
工作方式不像在帮助(
pandas
.
DataFrame
.append)
中
描述
的
那样,或者
在
各种网站、博客、回答问题等在线上。这正是我要做
的
import numpy as np dataset = pd.
DataFrame
.from_dict({"0": [0,0,0,0]
浏览 2
提问于2021-07-30
得票数 0
1
回答
根据列
的
重复
值折叠数据并删除
NaN
值
python
、
pandas
、
dataframe
我正在使用一个具有多个实验室值
的
病人数据库,每个实验室都有自己
的
行,
即使
在
同一天
也是
如此
。我想根据每个病人
重复
的
日期折叠行,以便每个日期有一行,其中包含当天
所有
实验室
的
结果。我尝试过各种groupby()和pd.merge()函数,但都
没有
效果。玩具例子:import numpy as np PID = [1, 1, 1, 2, 2, 2]
浏览 0
提问于2019-05-25
得票数 1
回答已采纳
2
回答
将包含键值对
的
列展开到它们自己
的
列
中
python
、
pandas
我有一个熊猫数据框架,看起来像这样: df = pd.
DataFrame
({'x':['''[{"key":"Gender","value":["Men"]}, {"key":"Shoe Category","value":[&quo
浏览 91
提问于2019-09-21
得票数 0
回答已采纳
1
回答
用最相似行
中
的
值填充缺失
的
值
python
、
pandas
、
data-science
以row 0和row 5为例,col2
中
的
值将为4.0。row 1和row 4
的
情况
也是
如此
。但是对于row 6,
没有
完全匹配
的
样本,所以我应该采用最相似的行-
在
本例
中
是row 0,并将
NaN
更改为3.0。我该如何处理呢?有
没有
能做到这一点
的
pandas
函数?example = pd.
DataFrame
({"col1": [3
浏览 6
提问于2019-05-09
得票数 6
回答已采纳
1
回答
合并具有重叠行和不同列
的
多个数据帧
python
、
pandas
、
dataframe
、
optimization
、
merge
我有多个
pandas
数据框,其中有一些公共列和一些重叠
的
行。我想以这样一种方式将它们组合在一起,即拥有一个包含
所有
列和
所有
唯一行(删除重叠/
重复
行)
的
最终数据帧。剩余
的
间隙应该是nans。 本质上,它逐一遍历
所有
列,添加每个数据帧
中
的
所有
值,删除
重复
项
(重叠),然后逐列构建新
的
输出
数据帧。],[51,61],[52,
浏览 24
提问于2021-10-15
得票数 1
回答已采纳
1
回答
如何正确地遍历范围和列表来创建
Pandas
Dataframe
?
python
、
pandas
我有函数get_differences,它
的
输出
是字典,如下所示。本例
中
的
数字并不相关,它只是此函数生成
的
输出
的
示例: 'Pos_obs_10%': -0.98, '
浏览 6
提问于2021-03-02
得票数 1
回答已采纳
1
回答
在
第一个
和最后一个实值之间寻找具有递归
nan
级数
的
列
python
、
dataframe
import
pandas
as pd 'a': [np.
NaN
, np.
NaN
, 3, 42, 3, np.
NaN
, np.
NaN
, 6, 7, 8, 9, 1 ,2]}) 这对我来说不是问题,但是:如果在列
的
第一个
实际值和最后一个值中有一系列
的
NaN
后面的2,我需要检测它们。但是,相反
浏览 6
提问于2020-05-28
得票数 0
回答已采纳
2
回答
Pandas
:
在
pivot_table
中
,如何自定义填充缺失值?
python
、
pandas
我想用索引
中
的
值填充我
的
Pandas
pivot_table
中
缺少
的
值,并填充缺少
的
Year Week列。,np.
nan
,30,np.
nan
] pivot = df.pivot_table(index=['Part','Static'], columns=[B 40
NaN
NaN
浏览 153
提问于2019-02-05
得票数 0
2
回答
删除
重复
项
并添加值
Pandas
python
、
pandas
、
dataframe
我希望删除
重复
项
,但是将E列
中
的
复制值添加到非
重复
记录
中
。import
pandas
as pddfp = pd.
DataFrame
({'A' : [np.
NaN
,np.
NaN
,3,4,5,5,3,1,6,7],Ab123455 12345.0 Appreciate Undo 我知道我需要使用dfp.loc[(dfp['A
浏览 0
提问于2017-06-06
得票数 3
回答已采纳
1
回答
PYTHON -合并日期索引上
的
两个数据格式
python
、
pandas
、
dataframe
、
merge
common dates这给了我一个合并
的
数据格式(df_PRIM_SECO),,但是这个df包含许多
重复
的
行()!from the merge这给了我所需
的
数据素数长度= 364229
浏览 1
提问于2020-01-04
得票数 1
回答已采纳
1
回答
把蟒蛇
输出
给熊猫
python
、
pandas
我试着把这个代码
的
输出
转化成熊猫
的
数据。我实际上只是试图提取
输出
的
第一部分,即股票符号、公司名称、field3、field4。
输出
有很多其他我不感兴趣
的
数据,但是它给了我一切。当前
输出
的
格式为 ["ABBV","AbbVie","_DRUGM","
S
&P 100,
S
&P 500"],[
浏览 1
提问于2022-02-26
得票数 2
回答已采纳
2
回答
如何消除潘达斯
DataFrame
行中长度3或更长
的
重复
?
python
、
pandas
我有一个数据集,它完全由表示空间数据
的
浮点值组成(基本上是一个曲面的水平切线)。有时,产生这些值
的
传感器会错误地这样做,并会在一行
中
重复
多个值。我希望删除长度3或更长
的
重复
序列,同时保留
重复
值
的
第一个
值和值
的
所有
其他
实例
(包括长度2
的
序列)。在行
的
开头有一个4长
的
0.2
重复
,
在
末尾有一个长达2
浏览 5
提问于2020-06-23
得票数 1
回答已采纳
6
回答
使用
NaN
值通过数据帧更新数据帧
python
、
pandas
、
dataframe
、
updates
我尝试更新
DataFrame
由另一个
DataFrame
浏览 4
提问于2018-10-10
得票数 8
1
回答
如何在不破坏
DataFrame
.append()
的
情况下继承或扩展
pandas
DataFrame
?
python
、
python-3.x
、
pandas
我曾尝试用子类来实现这一点,但添加到
DataFrame
会重新初始化新
实例
中
的
所有
属性,
即使
使用_metadata时
也是
如此
,正如推荐
的
here一样。我知道不推荐对
pandas
对象进行子类化,但我不知道如何使用组合(或任何其他方法)来做我想做
的
事情,所以如果有人能告诉我如何在
没有
子类化
的
情况下做到这一点,那就太好了。但是,以创建新副本
的
方式修改数据
浏览 15
提问于2020-12-20
得票数 1
回答已采纳
3
回答
当我将numpy数组转换为
Dataframe
时,它会将值更新为
Nan
。
python
、
python-3.x
、
machine-learning
、
imputation
import impyute.imputation.cs as imp Data = pd.
DataFrame
(data = imp.em(Data),columns = columns)当我执行上面的代码时,我
的
所有
值都被转换为
Nan
(如下所示),有人能帮我做错什么吗?
NaN
NaN
1
NaN
NaN
...
NaN
浏览 0
提问于2019-01-14
得票数 2
回答已采纳
1
回答
合并
重复
索引
的
值,其中
NaN
然后保留在第一位
pandas
、
numpy
、
interpolation
、
nan
、
data-cleaning
假设有一个很大
的
Timeindex-
DataFrame
a,
在
时间索引中有一些
重复
项
。 其中一些
重复
的
时间索引可能包含NaNs,其中第二个/第三个/...复制确实有一个值。如何将值“上推”到上面的NaNs
中
(以便填充它们),然后丢弃除
第一个
以外
的
所有
重复
项
?(这种向后填充应该只发生在相同日期时间
的
行之间,例如12.06.201
浏览 0
提问于2020-10-16
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习之计算工具库(三)
玩转Pandas,让数据处理更easy系列5
Python 数据处理库 pandas 入门教程
pandas系列学习(五):数据连接
机器学习之计算工具库(四)
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券