腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
在
一个
分类
变量
中
对
级别
进行
重新
分组
r
、
categories
我试图通过组合
分类
变量
的层次来简化数据分析。在这个
变量
中有6个
级别
,假设这个
变量
的名称是"candle“,
级别
是:"Always",”are“,”the“,”say“,"Never","Never”,NA 我想将“总是”和“几乎总是”
重新
组合为“是”,保留“有时”不变,将“很少”和“从不”
重新
组合为“否”。
浏览 38
提问于2018-02-01
得票数 0
回答已采纳
2
回答
选择
级别
数等于1的
分类
变量
。
r
、
apply
、
sapply
、
data-cleaning
在数据挖掘中
进行
预处理有时需要
重新
分组
和
重新
编码
分类
变量
。众所周知,一旦
在
R(即函数mapvalues)
中
对
范畴
变量
进行
了
重新
编码,就需要用df$variable <- factor(df$variable)更新
分类
变量
,以便可以使用str(df)查看data.frame
中
的实际
级别
数。我编写了一段代码来
浏览 7
提问于2015-07-17
得票数 2
回答已采纳
1
回答
你是如何用4个
分类
变量
中
的3个来
进行
分组
/总结的?
r
我有
一个
分类
变量
,我想用
一个
数值
变量
对
其
进行
分组
和总结。summarise (我认为使用filter()来删除第四个<em
浏览 4
提问于2022-03-24
得票数 1
回答已采纳
5
回答
对
多
分类
变量
进行
分组
并按
级别
进行
求和。
python
、
pandas
、
pandas-groupby
、
categorical-data
C 1203 A 103 C 60我必须按ID
对
其
进行
分组
,并根据页面的每个
级别
和相关的虚拟
变量
(这是
一个
简化的版本,我有3个以上的唯一页面)获取Time_on_page的总和: ID Page_A Page_B Page_C Time_on_page_A
浏览 2
提问于2019-07-03
得票数 0
回答已采纳
1
回答
对于预测机器学习模型,如何将高基数
分类
特征转化为数值特征?
python
、
machine-learning
、
data-science
、
data-cleaning
、
data-processing
我正在构建
一个
预测ML模型来预测网页上的点击量。page_entry:描述会话的登录页。
浏览 3
提问于2019-09-17
得票数 0
1
回答
如何从about GA和GTM收集数据
google-analytics
、
google-tag-manager
我有一些关于谷歌分析和谷歌标签管理器的问题,所以我有一些关于数据层名称“pageCategory”的值:“highlight-post”,"brand1","promotions“我尝试
对
促销
进行
分类
如何通过品牌定义促销我所做的事情是创建名为pageCategory的自定义
变量
,然后尝试
在
索引
级别
2上使用内容
分组
,但我尝试
在
behavior -> All页面上查看Google Analytic的结果,然后选择按内容<
浏览 0
提问于2018-11-09
得票数 0
1
回答
如何更有效地对
分类
变量
进行
重新
分类
?
r
、
categorical-data
我正在练习
一个
数据集,其中我有
一个
变量
S6。它包含6个
级别
/因素。Pharmacy 333 我想
重新
对
这个
变量
进行
分类
。ScienceBBA, CSE, Math, Economics = 2 我尝试了这种技术来
对
这个
变量
进行
重新
<
浏览 20
提问于2020-03-30
得票数 0
1
回答
对
分类
变量
的低频
级别
进行
分组
以提高机器学习性能
python
、
machine-learning
我正在努力寻找方法来提高机器学习模型的性能,无论是二进制
分类
,回归还是多项式
分类
。我目前正在尝试不同的阈值(30%,20%,10%)来将
级别
组合在一起。我想知道将这些“低频组”
分组
到
一个
称为
浏览 14
提问于2019-07-25
得票数 0
2
回答
如何对数据框架
进行
分组
并从长到宽
进行
整形?
python
、
pandas
、
group-by
、
pivot
、
melt
我
对
Python相当陌生,如果这个问题以前已经回答过,或者可以很容易地解决,请原谅。我有
一个
很长的数据框架,包括数值
变量
和
分类
变量
。Female 10 Beverage Milk Male 20 我想做的是:按类别和细节
分组
然后,我想
对
这些实例
进行
加权(请参阅列‘权重’)。这应该通过从列‘权重’
中
取值,然后用之和权重来
浏览 9
提问于2022-11-23
得票数 1
回答已采纳
1
回答
如何通过公共关键字组合相似
级别
的因子
变量
r
我有
一个
关于个人贷款的非常大的数据集的因子
变量
,有6000个
级别
。这些
级别
中
的许多都是相似的。“信用卡贷款”和“信用卡还款”,或“购车”和“汽车贷款”。有没有办法根据包含关键字的
级别
重新
调整该因子
变量
的
级别
,例如“信用”还是“汽车”? 当
级别
少得多时,我已经手动释放了因子
变量
,但由于数据集的大小,我需要一种自动方法来
对
级别
进行
分组</em
浏览 1
提问于2021-03-01
得票数 1
2
回答
文本
分类
-当训练数据和测试数据有不同的特性时该怎么办?
machine-learning
、
r
、
text-mining
、
random-forest
我正在执行二进制文本
分类
。我必须将一条推文
分类
为0(如果中立)和1(如果是仇恨言论)。Error in eval(predvars, data, env) : object 'run' not found 我的理解是,“run”是训练
浏览 0
提问于2018-03-16
得票数 1
回答已采纳
1
回答
Python更新
变量
级别
python
、
dataframe
我有
一个
分类
变量
:df‘’reason‘,有5个
级别
(0-4),我想将
级别
1和
级别
3
分组
到
一个
称为’水‘的新
级别
,将
级别
2和
级别
4
分组
为’非水‘,而不考虑
级别
0。所以我想在python
中
把它从5级减少到3级。我使用了for循环,但它没有返回正确的结果。感谢您的意见。
浏览 7
提问于2019-11-03
得票数 0
回答已采纳
1
回答
忽略GLM
中
的h2o因子
h2o
当您对
分类
变量
进行
一次性编码时,通常会在建模之前删除其中
一个
变量
。这样,您就没有
一个
与其他特性线性相关的冗余特性。 是否有一种方法可以指定不应该用于拟合的范畴
变量
的
级别
?:“我们强烈建议避免
对
任意
级别
的
分类
列
进行
一次热编码,因为这样做效率很低,对于习惯于为其他框架手动扩展
分类
变量
的用户来说尤其如此。
浏览 4
提问于2018-02-23
得票数 1
回答已采纳
0
回答
R
中
包含百分比的
分类
变量
表
r
、
dplyr
、
data.table
、
tibble
我有一系列
分类
变量
,它们有响应选项(有利、不利、中性)。 我想在R
中
创建
一个
表,它将在行
中
给出所有10个
变量
的列表(每行
一个
变量
)-
在
列中有百分比响应“有利,不利,中性”。这在R
中
是可能的吗?理想情况下,我还希望能够通过另
一个
分类
变量
对此
进行
分组
(例如,比较男性和女性
对
问题的不同反应)。
浏览 4
提问于2017-12-08
得票数 0
回答已采纳
3
回答
如何在
一个
热编码滑雪板之后保留列的名称?
python
、
pandas
、
scikit-learn
、
data-science
、
one-hot-encoding
为了处理
分类
数据,我把数据分成两组:一组是数值
变量
,另一组是范畴
变量
。
在
使用sklearn之后,
在
集上使用
分类
变量
进行
一次热编码之后,我尝试
重新
分组
两个数据集,但是由于
分类
集是ndarray,而另
一个
是我使用的dataframe:这是完美的,但我不再有我的
变量
的名字。
在
浏览 0
提问于2018-05-18
得票数 5
回答已采纳
1
回答
h2o DRF未见的范畴值处理
random-forest
、
h2o
态 因此,h2o将看不见的
级别
转换为NAs,然后
在
培训数据
中
以与NAs相同的方式对待它们。但是,如果培
浏览 0
提问于2018-10-24
得票数 1
回答已采纳
2
回答
如何选择R
中
具有最高
分类
变量
级别
的行
r
、
dplyr
3 19062167 Assault5 19062822 Rapedf$UCR_casetype<-factor(df$UCR_casetype, levels = c("Assault","Rape","Hom
浏览 6
提问于2020-04-20
得票数 1
回答已采纳
1
回答
取将由一组
分类
变量
分组
的大量
变量
的平均值
r
一个
是3个类别的
分类
变量
,其余是连续
变量
。这些列下面有50行。我如何通过
分类
变量
对数据帧
进行
分组
,并
对
每一列
中
具有该DF的连续
变量
的每一类
中
的观察值取平均值?另外,删除所有NA。
浏览 6
提问于2020-04-08
得票数 0
回答已采纳
2
回答
在
Power BI中将行
分组
为列时出现问题
powerbi
我
在
一个
仪表盘上工作。我有
一个
数据源,其中包含
一个
用逗号分隔的值为的列。我正在尝试使用这些列
对
行
进行
分组
。但是,默认情况下不对值
进行
分类
。我就可以得到这样的东西:Line 2 - C, B, ALine 4 - B, CLine 6 - AA, B, C - Line 1 and Line
浏览 0
提问于2021-02-26
得票数 0
1
回答
支持向量机e1071训练不起作用
r
、
svm
、
training-data
至少我没有得到目标列上的
级别
。下面是需要澄清的例子。 epsilon: 0.1 >如果我将此输出与wikibooks示例的输出
进行
比较请注意输出
中
的“
级别
”-Section:library(e1071)model <- svm(Sex~., data = cats) su
浏览 1
提问于2013-07-25
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
ML:教你聚类并构建学习模型处理数据
建模常用的概念介绍1:WOE、IV
分类回归树——来预测传说级的神奇宝贝吧
SPSS虚拟线性回归分析在问卷数据分析中的应用——杏花开生物医药统计
评分卡3
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券