腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
qcut
通过训练
数据
的
值
来
标记
所有
数据
?
、
qcut
在pandas中是一个很棒
的
功能。 但在正常
的
机器学习情况下,我们通常需要将
数据
拆分成训练
数据
和测试
数据
。 让我举一个例子: 我有一个包含7个
数据
的
数据
集。In [5]: pd.
qcut
([1,4,3,2,5,3,4], 3, labels=False) Out[5]: array([0, 1, 0, 0, 2, 0, 1]) 但是我想要
的
只是基于前5个元素
的
qcu
浏览 15
提问于2021-01-31
得票数 0
回答已采纳
1
回答
如何
定义pandas
qcut
标签
的
功能?
、
我
使用
pandas.
qcut
将
数据
划分为5个组,并希望根据最小和最大分数
标记
每个组。 例如,我尝试了
数据
框列中
的
"age“
数据
。df['age group'] = pd.
qcut
(df['age'], 5) 它
的
结果是 Categories (5, interval[float64]): [(37.999, 61.0] < (61.0, 67.0] < (67.0, 73.
浏览 19
提问于2019-04-16
得票数 1
回答已采纳
6
回答
如何
使用
非唯一
的
bin边进行
qcut
?
、
我
的
问题和前面的一样: 但是,我仍然希望在小数中包含0
值
。有没有办法做到这一点?换句话说,如果我有600个
值
,其中50%是0,其余
的
假设在1到100之间,我
如何
对小数1中
的
所有
0
值
进行分类,然后对小数标签2到10中
的
其余非零
值
进行分类(假设我想要10小数)。我是否可以将0转换为nan,将剩余
的
非nan
数据
切成9个小数(1到9),然后在每个标签(现在是2到10)上加1,并手动将<e
浏览 2
提问于2013-11-23
得票数 78
1
回答
为什么pd.
qcut
()会产生巨大
的
边界?
、
、
、
我有一个事件
数据
的
数据
帧,其中
的
一列是该事件发生
的
时间间隔。我想
使用
pd.
qcut
()使每个间隔
的
百分位数给定其中
的
事件,并为每个事件分配其各自
的
百分位数。in_interval = paired_events.loc[events['TimeInterval'] == event_row['TimeInterval']] quartiles = pd.
qcut
浏览 30
提问于2019-03-26
得票数 0
1
回答
固定宽度与自适应平顶
、
、
、
、
我
的
数据
中有一些连续变量,我希望应用二进制。这些
值
从0到800不等,但我
的
动机是
数据
分布是倾斜
的
,如下图所示:然而,我读过这个关于绑定
数据
这
的
惊人博客,其中作者声称adaptive binning比fixed-width binning更好我理解这背后
的
想法,因为我们在固定宽度方法中定义
的
一些回收箱与其他回收箱相比,
数据
分布可能太少,这将不是一个公平
的
游戏,因为在quanti
浏览 0
提问于2020-01-20
得票数 2
回答已采纳
2
回答
Pandas将
数据
帧分割为间隔,如果在间隔中,则获取值
、
、
我有一个
数据
帧,并根据col1中
的
值
将其分成10个分位数: pd.
qcut
(df.col1, [0,.1,.2,.3,.4,.5,.6,.7,.8,.9,1]) 这就产生了一系列
的
间隔。根据col2中
的
所有
值
,这些
值
位于之前创建
的
间隔内,如下所示:
qcut
= pd.
qcut
(df.col1, [0,.1,.2,.3,.4,.5,.6,.7,.8,.9,1]) qlist =
浏览 28
提问于2020-09-04
得票数 0
回答已采纳
1
回答
有没有办法在滑雪管道中连锁pd.cut FunctionTransformer?
、
、
、
我正在努力制作一个DataFrame预处理管道,
使用
sklearn并链接各种类型
的
预处理步骤。我想链接一个SimpleImputer转换器和一个应用pd.
qcut
(或pd.cut)
的
FunctionTransformer,但是我一直收到以下错误:]) 如果我简单地将FeatureSelector转换器和FunctionTransformer链接到pd.
qcut
,而忽略了Simpl
浏览 1
提问于2020-06-17
得票数 3
回答已采纳
1
回答
pd.
qcut
的
值
为inf (无穷大) ValueError: Bin边必须是唯一
的
:
、
、
我有一个
数据
集,它是两个浮点数
的
比率。有些
值
具有无穷远(除以零)情况下
的
inf。
如何
使用
pd.
qcut
/pd.cut和inf
值
一起工作? ValueError: Bin edges must be unique: array([ 1.20089207e+03, 6.02984295e
浏览 8
提问于2017-01-05
得票数 1
回答已采纳
2
回答
如何
将我在pandas中
的
数据
拆分为指定
的
存储桶,例如40-40-20?
、
、
、
全, 我尝试将我
的
数据
分成3个存储桶,分别为40%、40%和20%。我怎么才能用熊猫做到这一点呢?例如,你得到最低
的
40%,中间
的
40%和最高
的
20%: pd.cut(df['count'], 5,labels = ['1','2','3','4','5'],retbins=True) 上面分成5个五分位数
浏览 19
提问于2021-05-07
得票数 0
回答已采纳
1
回答
入库逻辑中
的
Panda.
qcut
、
我正在尝试用不同
的
方法对连续变量进行分类。我
使用
了两个方法- bin_sequence和entropy_based_binning方法
qcut
。为了测试,我创建了一个具有100个
值
的
数据
。我将前50条记录
的
值
设置为1,接下来
的
几条记录设置为2,几条记录
的
值
设置为5,12,然后随机设置几个数字,从而使
数据
倾斜。 当我试图用数量=6
的
bins运行它时,它只用
q
浏览 25
提问于2020-09-09
得票数 0
2
回答
将pandas
qcut
箱应用于新
数据
、
我
使用
pandas
qcut
将一些
数据
分成20个bin,作为训练二分类模型
的
数据
准备
的
一部分,如下所示:我
的
问题是,我
如何
将从上面的
qcut
语句派生
的
相同绑定逻辑应用于一组新
数据
,例如用于模型验证目的。有什么简单
的
方法可以做到这
浏览 0
提问于2016-06-19
得票数 33
回答已采纳
1
回答
如何
通过
qcut
获取bin
值
、
我应用pd.
qcut
将我
的
数据
压缩到24个存储区。
如何
将bin
值
放入列表?-0.001,1.05,2.46,3.797...res.cat.categories IntervalIndex([(-0.001, 1.05
浏览 1
提问于2019-02-07
得票数 0
1
回答
dataframe中每列
的
分位数值
、
、
我有一个由数字列组成
的
数据
帧。我正在尝试计算每一列
的
十进制排名
值
。下面的代码给出了整个
数据
帧
的
值
。我怎么按列
来
做呢?谢谢。
浏览 2
提问于2018-05-03
得票数 0
1
回答
Pandas
qcut
使用
相同
的
数据
返回两个不同
的
结果
、
我创建了两个相同格式
的
虚拟
数据
,然后
使用
pd
qcut
得到了不同
的
结果。请告诉我
如何
使输出正确(如
数据
1)?
数据
1:df1=df[['X']].assign(var_bin=lambda x: pd.
qcut
(x['X'], q=20
浏览 0
提问于2021-03-16
得票数 0
1
回答
需要创建具有相同数量
的
存储箱。还需要生成一个报告,其中包含仓库和切割之间
的
交叉表
、
、
我
使用
的
是菱形
数据
集,下面是列 ? 问题:创建具有相同数量
的
存储箱。还需要生成一个报告,其中包含仓位和切割之间
的
交叉表。表示每个单元格下
的
数字占总数
的
百分比 我有上面的问题。虽然我是一个初学者,但我创建了Volume列,并尝试
使用
qcut
创建具有相同数量
的
bin,但我无法继续。有人能帮我找到解决这个问题
的
方法吗?pd.
qcut
(diamond['Volume
浏览 25
提问于2020-06-11
得票数 0
回答已采纳
4
回答
熊猫不把相同数量
的
观察放进每个垃圾箱
、
、
我有一个
数据
框架,我可以从中选择一个列(系列)如下: value_rank275490 35275497 69275499 83value_rank是以前从更大
的
数据
集中创建
的
百分位数等级我想要做
的
是创建这个
数据
集
的
回收箱,例如五分位数。pd.<
浏览 4
提问于2016-02-03
得票数 14
回答已采纳
1
回答
Pandas -在保留NaN
的
同时对数值列进行装箱
、
我在
数据
框中有一个列,其中包含数值(例如年龄),并希望将其绑定到几个类别(或范围)中,如下所示: df['Age_binned'] = pd.
qcut
(df['Age'], 5, duplicatesdrop') 这会产生以下范围: (-0.001, 36.0](45.0, 54.0](62.0, 87.0] 但是,我知道该列还包含一些NaN
值
,我希望将它们作为单独
的
bin处理。我
如何
才能做到这一点呢
浏览 4
提问于2021-01-17
得票数 0
1
回答
如何
保存.
qcut
()中
的
时间间隔?
、
、
、
我被告知要
使用
.
qcut
()
来
查找给定
的
每个百分位数
的
值
。返回
值
是列表中相同
的
间隔
值
。
如何
将间隔
值
保存到每个特定
的
百分位数?[In] pd.
qcut
(df['A'], 4)824448 (35.881, 1363.92] 3450257 (
浏览 18
提问于2019-06-06
得票数 0
1
回答
Python - Pandas群和过滤器
、
、
、
我把它作为一个csv在熊猫中工作--前十排: permno price mv yearmonth8692 10241 30.8750 5.742132e+06 198303 data_q80=data_q80[data_q80["mv"]<=q80[yearmonth]]
浏览 0
提问于2019-04-01
得票数 0
回答已采纳
1
回答
当我们只有一个输入,没有序列时,我们可以
使用
LSTM模型吗
、
、
、
我有一系列可用
的
数据
。我可以
使用
这个
数据
集
来
训练LSTM模型。假设我
使用
t,t+1,...,t+5
来
训练我
的
模型并预测t+6
使用
LSTM可以做到这一点吗,或者唯一
的
方法是
通过训练
中
使用
的
所有
时间步长
来</e
浏览 14
提问于2021-03-01
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何使用数据、人工智能和云来改变您的建筑运营
非 0即1,如何将庞大 Excel 数据表中的所有非 0 值批量替换为 1?
存储量扩大千倍,Discord 是如何使用Rust语言和ScyllaDB数据库来改进架构的?
AI凭什么听你的?灵魂三问GPT是什么?GPT如何训练?训练后怎么用?上
Python之数据规整化:清理、转换、合并、重塑
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券