腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(3888)
视频
沙龙
1
回答
向
pandas
dataframe
添
加按
zscore
分组
的
列
、
、
我可以将一
列
插入到数据框中,并对另一
列
进行z评分,如下所示:我可以简单地缩减一个由2个其他
列
组成
的
列
,如下所示: [2] df.groupby(['C1', 'C2'])['A'].
浏览 5
提问于2016-09-10
得票数 6
1
回答
函数在多指标熊猫
DataFrame
中
的
应用
、
、
、
、
这是我正在研究
的
DataFrame
的
一个示例:import numpy as npdf = pd.
DataFrame
, 268906, 312084, 现在,我通过将scipy.stats.
zscore
应用于每一
列
,并使用f
浏览 1
提问于2020-01-24
得票数 0
回答已采纳
4
回答
如何用nans规范熊猫专栏?
、
、
、
我有一只熊猫数据,其中有一
列
我想要标准化
的
真实值:array([ nan, 0.0767, 0.4383, 0.7866, 0.8091, 0.1954, 0.6307,0.6599, 0.1065, 0.0508])问题是,单个nan值将使所有数组nan>> <em
浏览 1
提问于2014-05-04
得票数 25
回答已采纳
1
回答
将
分组
列
的
离群值替换为基于定义
的
zscore
的
组平均值
、
、
我有一个非常大
的
dataFrame
,在地图上有许多数据点,其中有异常值,它们在数据集(纬度和经度)上非常接近。我想对A
列
的
所有行进行
分组
,计算它们
的
zscore
,并用组
的
平均值替换
zscore
> 1.5
的
组中
的
每个值。我尝试过
zscore
值表,但没有成功。<**
zscore
= lambda x : (x - x.me
浏览 4
提问于2021-02-14
得票数 0
回答已采纳
2
回答
滚动Z评分在熊猫数据处理中
的
应用
、
、
我想为我
的
dataframe
中
的
一
列
计算Z-滚动分数:是否有类似于这样做
的
方法:也许有:stats.
zscore
(df) 编
浏览 0
提问于2020-01-05
得票数 2
回答已采纳
1
回答
在数据集中实现Z-得分时获取"KeyError“
、
、
、
是训练和测试数据集作为数据集
的
组合,并经过一次热编码。'] =
zscore
(combined_data['
zscore
']) File ~/anaconda3/envs/tf-gpu/lib/python3.8/site-packages/
pandas
/core/frame.py:2800, in
DataFrame
._libs.hashtable.PyObjectHashTable
浏览 18
提问于2022-04-19
得票数 -1
回答已采纳
1
回答
用Python /
Pandas
计算Z分数时
的
非零均值
、
我正在尝试一次计算一系列
列
的
z分数,但是检查数据会发现
列
的
平均值并不像计算z-得分时所期望
的
那样为0。df = pd.
DataFrame
({'a': [500,4000,20], 'b': [10,20,30],
浏览 1
提问于2020-02-07
得票数 0
回答已采纳
9
回答
熊猫-计算z-所有栏
的
得分
、
、
、
、
我有一个包含一
列
ID
的
数据,所有其他
列
都是我想要计算z分数
的
数值。2 39 18.1 3我
的
一些
列
包含NaN值,我不想将这些值包含在z-得分计算中,因此我打算使用为这个问题提供
的
解决方案:。df['
zscore
'] = (df.a - df.a.mean())/df.a.std(ddof=0) 我有兴趣将此解决方案应用于除ID
列
之
浏览 10
提问于2014-07-15
得票数 74
回答已采纳
1
回答
在Python中,在groupby之后应用
Zscore
、
、
、
我正在尝试对
分组
数据集应用函数。为此,我有这个
Pandas
数据帧: test_df = pd.
DataFrame
({ 'AA':['2020-03-22', '20201,0.5,4,5,5,4], 'D':[1,3,1,7,1,1], 'E
浏览 41
提问于2020-04-17
得票数 2
回答已采纳
1
回答
为什么在
Pandas
dataframe
中使用Z-score进行标准化会生成NaN
列
?
、
、
、
我使用scipy中
的
Z-score对我
的
数据集进行归一化,如下所示:import
pandas
as pdfromscipy.stats import
zscore
df = df.dropna(how(df.describe()) df = df.apply(<em
浏览 0
提问于2018-05-06
得票数 2
回答已采纳
2
回答
pandas
DataFrame
(python)中
的
Z-score归一化
、
、
、
我正在使用python3 (spyder),我有一个表,它是对象"
pandas
.core.frame.
DataFrame
“
的
类型。我想对该表中
的
值进行z-score归一化(每个值减去其所在行
的
平均值,再除以该行
的
sd ),这样每一行都有mean=0和sd=1。我尝试了两种方法。第一种方法 from scipy.stats import
zscore
zetascore_table=
zscore
(table,axis=1) 第二种方法 rows
浏览 122
提问于2020-01-10
得票数 2
回答已采纳
2
回答
将
列
添加到作为另一
列
的
函数
的
pandas
数据框中
, 'Width']stats = pd.
DataFrame
(index这是我想要
的
那样工作,但是我必须迭代数据框中
的
每一行。我还需要计算每一
列
的
z_score,但是为了简单起见,我在本例中只计算温度
列
。76.2 NaN NaN 0.650794
浏览 0
提问于2016-11-21
得票数 0
1
回答
Python/
Pandas
:删除带有外围值
的
行,保留所有
列
、
、
我有一个包含许多数值和分类值
的
数据集,我只想测试数值列上
的
外围值,并根据这些
列
删除行。我就是这样尝试
的
:但是,它将删除所有
列
中
的
所有外围值,当然,因为我有分类
列
,因此遇到以下错误:TypeError:不支持
的
操作数类型(S)用于+:'float‘和'str’ 我知道上面的解决方案是有效
的</
浏览 0
提问于2018-03-20
得票数 1
回答已采纳
1
回答
有没有办法在python中绘制z值?
、
我有一个程序,使用matplotlib和熊猫来绘制比特币价格
的
滚动均值和标准差。我想知道如何绘制z值(标准差
的
数目,价格与平均值)。import
pandas
as pd df1_btc['S
浏览 2
提问于2019-11-10
得票数 1
回答已采纳
1
回答
如何为缺失值添加NaN groupwise
、
我有一个类似于这个
的
DataFrame
: value name year 0 0.0
浏览 4
提问于2018-03-03
得票数 1
回答已采纳
1
回答
PySpark:带有标量
Pandas
的
无效returnType
、
、
我正在尝试从
pandas
_udf返回一个特定
的
结构。它在一个集群上工作,但在另一个集群上失败。我尝试在组上运行udf,这需要返回类型为数据框架。from pyspark.sql.functions import
pandas
_udfimport numpy as np oneCar.loc[1:, 'Lati
浏览 2
提问于2018-03-26
得票数 5
回答已采纳
1
回答
将差异
列
从另一
列
添加到
dataframe
的
组
、
给出以下示例代码:import numpy as npdf = pd.
DataFrame
({'A' : ['foo', 'foo', 'bar','foo', 'bar', 'foo', 'foo'], 'B' : np.random.randint(0,100,8
浏览 4
提问于2018-01-08
得票数 2
回答已采纳
1
回答
为什么它显示为空数组?
、
、
、
、
当我设置一个阈值并打印低于该阈值
的
数据时,我使用z计分方法来去除..but
的
异常值,我得到了空数组。我试过下面的代码。from scipy import statsprint(z) print(np.where(z>7)) 它显示了下面的输出,其中显示了一个值
的
数组。
浏览 0
提问于2021-02-03
得票数 0
2
回答
如何使用统计模型获得多元线性回归
的
标准化(Beta)系数
、
、
、
、
当使用.summary()函数与
pandas
统计模型一起使用时,OLS回归结果包括以下字段。coef std err t P>|t| [0.025 0.975] 我如何获得标准化
的
系数(不包括截距),类似于在SPSS中可以实现
的
?
浏览 2
提问于2018-06-14
得票数 9
2
回答
如何将一栏分割成多栏?
、
,并将其转换为新
的
一行,例如,前15行应该变成名为AARTIIND
的
一行,日期为2000-01-03,然后是具有每日累积回报
的
15
列
。fourth fifth .... fifteenth为了将我使用
的
数据月份进行
分组
pd.
DataFrame
(columns = ('name', 'date'
浏览 7
提问于2016-12-05
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券