腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使
用上
一行
的
值
在
df
中
按
groupby
插
入行
python
、
pandas
、
dataframe
、
missing-data
我需要根据
groupby
类型
的
列week插
入行
,
在
某些情况下,我在数据框中间
的
不同位置缺少周,我想插
入行
以填充缺少
的
行作为最后一个现有行
的
副本,
在
本例
中
,第7周
的
副本填充第8周和第9周,第11周
的
副本填充第12周、第13周和第14周
的
行:在此表
中
,您可以看到从第7周到第10周和从第11周到15周
的
跳跃: ? 完美的输出将如
浏览 36
提问于2021-07-22
得票数 0
回答已采纳
1
回答
Pandas
中
与每
一行
水平独立
的
插
值
python
、
pandas
、
resampling
我有这样
的
数据1,1520320347531.0,59.3635,18.2828,1520324772351.0,59.5031,18.4745如果数据是垂直排列
的
,则此代码内插非常完美,但我不确定如何对该行进行水平
插
值
。即使
在
两个不同
的
行中有相同
的
I,我也希望
使
内插独立于每
一行
。
df
=
df
.set_inde
浏览 1
提问于2018-06-15
得票数 1
回答已采纳
2
回答
PySpark -添加一个递增
的
数字列,该列根据另一个列
值
的
变化重置为1
python
、
pyspark-dataframes
首先,我应该说,我对Python和PySpark都很陌生,我
的
大部分经验都是
在
MS、C#、VB.NET等方面。 我有一个数据帧,我想在其中添加一个'group_number‘字段。04|2 |+-----+----------------+-------------+ 日期时间
值
是不相关
的
,因为它们可以
在
不同
的
点开始和结束,并且
在
每个组
中
以不
浏览 57
提问于2020-01-23
得票数 0
回答已采纳
1
回答
比较Pandas
中
的
数据
python
、
pandas
、
matplotlib
、
pandas-groupby
这是我
的
数据集,显示食物和他们
在
不同年份得到
的
分数。我想做
的
是找出平均得分最低和最高
的
食物,并追踪这些年
的
得分。menu[menu.Food == Max & menu.Food == Min] 基本上,我希望它能在数据图中显示类似下面的内容,这样我就可以绘制一些图表(也就是说
浏览 8
提问于2022-03-21
得票数 1
回答已采纳
3
回答
逐行线性计算
python
、
pandas
、
dataframe
、
imputation
我有一个时间序列特征
的
数据帧。我想用逐行线性计算来计算丢失
的
值
。作为一个可复制
的
例子:import numpy as np对于F1,我希望使用F1_Date_1和F1_Date_3线性地计算(
插
值
) F1_Date_2。对于F2,我想使用F2_Date_1和F2_Date_4来计算F2_D
浏览 6
提问于2022-06-03
得票数 2
回答已采纳
2
回答
基于不同列
的
熊猫
插
值
NaNs
python
、
pandas
、
interpolation
我
的
数据
中
还有这
一行
现在,我想在NaN
的
基础上进行
插
值
以填充wind_speed。谢谢我已经找到了解决上述问题
的
办法。诀窍是使用
groupby
并定义一个函数,该函数
在
groupby
创建并传递给apply()
的
dataframe上进行
插
值
。
在
我
的
例子
中</e
浏览 2
提问于2014-12-01
得票数 12
回答已采纳
1
回答
插
值
熊猫
df
python
、
pandas
、
interpolation
我知道这个问题是
在
堆栈溢出问题上提过几次
的
,但是我仍然遇到了一个
插
值
问题。我有一组列
的
复杂数据,如果简化的话,这些列看起来可能是这样
的
:wl = np.array([400.0, 408.2, 412.5, 417.2, 420.5, 423.3, 425.0]) 因此,
浏览 0
提问于2018-07-10
得票数 3
回答已采纳
1
回答
如何改变熊猫
的
生命周期
python
、
pandas
、
jupyter-notebook
我有一个数据帧,我需要按照规则更改3d列我写了一个使用循环
的
代码,但是这个代码是永远有效
的
。我用纯python写了一段代码,但肯定有更好
的
方法用pandas来做这件事。那么,如何用pandas重写我
的
代码来减少时间呢?=
df
_sort.iloc[i, 0]): conti
浏览 17
提问于2019-07-23
得票数 0
回答已采纳
3
回答
按
类别分类
的
句子中最常见
的
词
python
、
pandas
我正试着把10个最常见
的
词
按
类别分组。我已经看到了
的
答案,但我不能完全修改它以获得我想要
的
输出。dog runs over big cat C including this one big: 2 C including: 1 由于我
的
数据很大,我
浏览 0
提问于2018-10-03
得票数 4
回答已采纳
1
回答
如何为我
的
多索引pandas数据帧
中
的
每个级别(0)只选择前两行?
python
、
pandas
、
pandas-groupby
、
multi-index
假设我有一个
df
,我
按
两列分组。然后,我希望只获取grouped by object
的
前两行。即 grouped_data =
df
.
groupby
(['company','person']).first() 那么如何为每
一行
选择前两行呢?例如,company = asda有8行,即该公司下
的
9个人,但我只想要前两行。我如何使
用上
面的数据帧来做这件事?注我之所以使用first,是因为
在
grou
浏览 16
提问于2020-07-17
得票数 0
1
回答
时间序列
中
缺失条目的Pandas
插
值
python
、
pandas
、
datetime
、
time-series
附件是我正在处理
的
一种时间序列。如果我们看到
df
,每个名称
的
时间戳都是不同
的
。此外,
在
某些地方还缺少时间戳和
值
。我正在尝试得到一个时间序列,其中该序列从时间序列
的
最小元素映射到时间序列
的
最大元素。此外,如果内插/外推,则缺少
值
。= pd.DataFrame(s)s.columns = ['datetime', 'value1', 'v
浏览 0
提问于2021-04-28
得票数 0
2
回答
熊猫有条件地将
值
从一列复制到另
一行
python
、
pandas
、
conditional-statements
、
data-science
我有这个数据: 我希望将Date列
的
值
复制到New_Date列,但不仅要复制到相同的确切行,还要复制到具有相同User_ID
值
的
每
一行
。因此,它将是: 我尝试了
groupby
,然后复制,但是
groupby
使
所有的
值
都变成了列表,具有相同user_id
的
其他列可以
在
不同
的
行中有不同
的
值
,然后它会混淆许多事情。], axis=1) 但是,
浏览 4
提问于2022-08-11
得票数 0
回答已采纳
1
回答
如何按键分组,并在单行
的
其他列
中
返回min/max
值
?
python-3.x
、
pandas
、
dataframe
、
lambda
、
group-by
我有一组数据,我试图根据A列
中
的
公共键对其进行分组,我希望它能够
在
每个分组键值
中
返回
一行
信息。分组很容易,但是其他列返回我需要
的
值
时有问题。”只为每个分组键提取最小
值
,然后
在
单行
的
"B“列
中
显示该最小
值
的
其余列
值
,但它输出列"D”
的
NaN
值
。和ffill().tail(1)中使用
gr
浏览 0
提问于2021-06-18
得票数 1
回答已采纳
1
回答
在
熊猫
中
,多索引
的
Dataframe如何
按
顺序进行过滤?
python
、
pandas
>>> import pandas as pd>>>
df
= pd.DataFrame.from_records(L).set_index([0,1]) 2 31 A 9 9 C 8 8
浏览 4
提问于2017-03-12
得票数 3
回答已采纳
1
回答
具有多变量
的
组-by
python
、
pandas
、
group-by
因此,在这个例子
中
,
中
位身高是98;而猫
的
平均体重比平均身高高53 (平均50,56)。我有很多不同
的
动物类型,所以我不想手动指定动物类型。随着时间
的
推移,除了猫
的
重量之外,还有其他我想要测量
的
东西(所以我正试图
在
将来对我
的
代码进行一些验证)。
在
浏览StackOverflow时,我
的
方法是:(1)编写一个函数,告诉我要度量
的
代码
的
其余部分: def column_
浏览 1
提问于2020-10-12
得票数 2
回答已采纳
1
回答
如果
值
大于,如何插
入行
和
插
值
python
、
pandas
、
numpy
、
dataframe
、
pandas-groupby
我正在处理巨大
的
数据集,我需要在数据缺失
的
地方插入新行,并对其进行
插
值
。每个组
的
数据
值
是
按
升序排列
的
(对于每个组,我们总是必须从0.5开始),并且
在
示例中看到
的
缺失数据
的
标志是当值差异大于0.5时。当我需要将它与
groupby
函数组合在一起,以便"A“组
的
最后一个
值
不会干扰"B”组
的
第一个
值
浏览 19
提问于2020-11-27
得票数 0
1
回答
大熊猫
的
样本和最近
的
插
值
只给出NaNs。
python
、
pandas
、
dataframe
、
interpolation
、
pandas-resample
我有一个数据(
df
,时间作为索引和1列'Pt0'),我想用“最近
的
邻居”方法对其进行抽样和
插
值
。我有两个问题: 当我计算时,我得到一个对象core.resample.DatetimeIndexResampler,它
使
我无法恢复列
的
值
(但我可以得到索引),而我只想要一个数据作为输出。如果我直接应
用上
采样和
插
值
:
在
我有NaNs和
值
之前,
df
= <
浏览 6
提问于2022-01-29
得票数 1
回答已采纳
2
回答
多值数据
的
快速字典转换
python
、
dataframe
、
dictionary
、
group-by
、
apply
我
的
最终目标是创建一个字典,其中元组(A,B)表示键,
值
C和D作为numpy数组存储
在
每个键下。如果我只想存储C或 D,我可以把它写成
一行
,但我很难做到这两点。这就是我所拥有的
按
预期工作,即每个键
的
数据是一个dim(N,但如果我尝试以下几点: ou
浏览 3
提问于2020-04-30
得票数 0
回答已采纳
1
回答
熊猫组:组中最后一组,第一组
python
、
pandas
我有一个
按
多列分组
的
数据。
在
每个组
中
,我想生成一个
值
,该
值
查找每个组
的
最后一个实体,然后除以第一个实体。我还想显示实体
的
数量和输出
中
的
最后一个实体
值
。 有关示例数据和所需输出,请参见下面的内容。我知道如何显示组
的
计数,代码如下所示。
df
_group=
df
.
groupby
(['ID','Item
浏览 0
提问于2018-11-06
得票数 2
回答已采纳
1
回答
Python interpolate不会抛出错误,但也不会执行任何操作
python
、
pandas
、
dataframe
、
interpolation
因此,我创建了一个简单
的
函数来接收列
的
列表,并对每一列应用
插
值
函数。(how = 'linear')) 然而,我得到
的
问题是,当所有其他列都被成功
插
值
时,其中一列(访问电力(具有访问权限
的
城市人口
的
百分比) 1.3_ACCESS.ELECTRICITY.URBAN)似乎不能
插
<
浏览 2
提问于2018-04-24
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python之数据聚合与分组运算
在Pandas中通过时间频率来汇总数据的三种常用方法
Pandas与SQL的数据操作语句对照
Pandas中比较好用的几个方法
开启机器学习的第一课:用Pandas进行数据分析
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券