腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
在
R
中
的
新
变量
列
中
创建
新
的
分类
变量
级别
、
我是newbee to
R
,所以被困在这里..我有一个明确
的
数据 levels(df$SO) "SO1", "SO2","SO3","SO4","SO5","SO6",SO7",SO8" 我想将这些
级别
重新
分类
,如下所示,但将它们保存为同一DATAFRAME
中
的
新
列
(df$newSO)。我正在使用下面的代码 lev
浏览 12
提问于2020-03-25
得票数 1
2
回答
基于条件将不同
的
虚拟
变量
组合成单个
分类
变量
(互斥类别)?
、
我是
R
的
新手,正在尝试
创建
一个基于三个虚拟
变量
的
新
变量
,使之成为具有4个
级别
(0,1,2,3)
的
单个
分类
变量
,其中应该包含相互排斥
的
类别。 这里有一些我想要
的
输出
的
规格。如果g_kom = 0,则
新
变量
的
值应为0。如果g_kom = 1,则
新
变量
的<
浏览 28
提问于2021-02-10
得票数 0
回答已采纳
1
回答
SQL Server
R
Services中使用lm-模型进行预测时
的
“因子有新水平”错误
、
、
、
我是
R
方面的新手,但试图将它与一起使用。print(coef(model));' @language =N'
R
'
中
的
错误(术语、
新<
浏览 1
提问于2018-04-19
得票数 1
3
回答
如何去除
R
中
的
一个因子级?
、
我需要将
变量
从
R
中
的
数据帧
中
删除,我
的
数据有一
列
有18个因素: drop if rama1 == 99 (rama1是因
浏览 1
提问于2015-08-30
得票数 1
回答已采纳
2
回答
Linq to SQL:只对具有空值
的
字段加载默认值
、
、
我将Linq到-SQL用于获取记录名为
的
表,而Record有一个名为Level
的
列
,其默认值通过数据库声明定义为-1。我希望我
的
C#应用程序像这样插入
分类
类型
的
新
记录
R
: 如果定义了
变量
R
的
字段
级别
(NULL):使用此字段
的
值进行
浏览 12
提问于2013-11-15
得票数 0
回答已采纳
1
回答
R
中一个单元格
中
具有多个值
的
变量
分类
我是
新
的
编码
在
R
和张贴在这里,所以请告诉我,如果我可以添加任何有用
的
东西。我试图
创建
一个
新
的
分类
变量
“收入”(3级),将预定国家
的
子集(x,y,z)
分类
为不同
的
级别
。我
的
问题是,countries
变量
在
每个单元格中有多个国家,所以我不知道如何
分类
。HMIC 3
浏览 4
提问于2022-07-20
得票数 2
7
回答
如何折叠类别或重新
分类
变量
?
、
、
在
R
中
,我有600,000个
分类
变量
,每个
变量
都被
分类
为"0“、"1”或"2“。我想要做
的
是折叠"1“和"2”,并保留"0“本身,这样
在
重新
分类
"0”=“0”之后;"1“= "1”和"2“= "1”。最后,我只想让"0“和"1”作为每个
变量
的
类别。此外,
浏览 4
提问于2010-07-17
得票数 7
回答已采纳
1
回答
PySpark:我们应该迭代更新数据吗?
、
、
、
我
的
问题有两部分。第一种是了解火花
的
工作方式,第二种是优化。 我有一个火花数据,它有多个
分类
变量
。对于这些
分类
变量
中
的
每一个,我将添加一个
新
列
,其中每一行都是相应
级别
的频率。),我要添加一个
新
变量
Freq_State。
级别
NY
在
dataset
中
显示4500时间,因此该行将在Freq_State
列</em
浏览 1
提问于2018-04-19
得票数 2
9
回答
从
分类
变量
创建
新
的
虚拟
变量
列
我有一个包含75,000个观察值
的
多个数据集和一个可以取值为0-4
的
type
变量
。我想为所有类型
的
每个数据集添加五个
新
的
虚拟
变量
。我能想到
的
最好
的
方法是:binom.dummy.listbinom.dummy.df<-transform(binom
浏览 2
提问于2010-08-02
得票数 39
回答已采纳
2
回答
如何将我
的
数值数据绑定到具有两个
级别
的
分类
变量
中
我目前有一个包含从0到3000
的
大范围数字数据
的
数值
列
( variable $numberseen),但我想将其转换为一个具有两个
级别
的
新
分类
变量
:存在(number > 0)和缺席(number seen我该如何
创建
它?
浏览 8
提问于2020-04-10
得票数 0
回答已采纳
5
回答
使用ifelse进行
分类
、
我有一个很大
的
数据集,我希望在其中
创建
一个
新
列
,用于重命名现有
列
中
的
分类
变量
。现有
列
(称为"Side")
中
的
三个可能值是'l‘、'
r
’和'c‘。
在
新
的
列
中
,我希望将现有
列
中标记为'l‘
的</
浏览 1
提问于2020-08-28
得票数 1
2
回答
使用
R
根据
变量
创建
聚合
列
、
、
、
如果这是一个菜鸟问题,我很抱歉,但我
在
论坛上看了看,找不到一种方法来搜索我想要做
的
事情。我有一个训练集,我正在试图找到一种方法来减少我
的
分类
变量
的
级别
数量(在下面的示例
中
,类别是状态)。一旦输入到数据框
中
,我
的
训练集将如下所示:1 CA 1 03 NY 00 0 7 AZ
浏览 0
提问于2012-01-05
得票数 1
回答已采纳
1
回答
Python :理解
分类
变量
的
d树输出
、
、
、
、
数据集具有所有的
分类
特性,与
R
不同,Python需要对
分类
变量
进行虚拟编码。我使用以下代码对所有
分类
变量
执行虚拟编码:df_with_dummies = pd.get_dummies(df2, columns = col_names) 虚拟编码根据每个
列
的
因素数
创建
<
浏览 1
提问于2017-07-02
得票数 0
回答已采纳
1
回答
计算pyspark Dataframe
中
的
列
数?
、
、
、
我有一个有15
列
的
数据帧(4
列
是
分类
的
,其余
的
是数字
的
)。print type(df.printSchema())
浏览 10
提问于2017-03-15
得票数 5
回答已采纳
2
回答
R
-基于freq表
变量
的
级别
创建
新
列
嗨,我是新来
的
,所以请耐心听我说, Length Seq X 29 GTGCACCGCAAGTGCTTCTAAGAAGGATC 19 count(dF, vars=c("Length", "X")) 要生成一个如下所示
的
freq198 410 104
浏览 4
提问于2015-04-24
得票数 1
1
回答
从拟合
的
lm或glm [
R
]
中
获取每个因子
级别
(以及交互作用)
中
的
数据数量
、
、
、
、
我
在
R
中有一个逻辑回归模型,其中所有的预测
变量
都是
分类
的
,而不是连续
的
(除了响应
变量
,它显然也是
分类
/二元
的
)。
在
调用summary(model_name)时,有没有办法
在
每个因子
级别
中
包含一个表示观察值数量
的
列
?
浏览 73
提问于2018-07-19
得票数 2
回答已采纳
1
回答
取将由一组
分类
变量
分组
的
大量
变量
的
平均值
我有500
列
。一个是3个类别的
分类
变量
,其余是连续
变量
。这些
列
下面有50行。我如何通过
分类
变量
对数据帧进行分组,并对每一
列
中
具有该DF
的
连续
变量
的
每一类
中
的
观察值取平均值?另外,删除所有NA。我想根据此信息
创建
一张
新
CD。 最好
的
,亨利
浏览 6
提问于2020-04-08
得票数 0
回答已采纳
1
回答
如何对
列
中
的
字符串数据进行编码,以便应用机器学习技术进行
分类
,例如k-means?
、
、
、
、
我
在
一个具有各自ID (RangekksId)
的
列
中有字符串
变量
(RangeVarName)。我需要
创建
一个算法,将
新
的
变量
分类
到现有的ID,或者如果不可能,将它们单独放在N/A类
中
。 ? 如何对
列
中
的
字符串数据进行编码,以便应用机器学习技术进行
分类
,例如k-means?
浏览 34
提问于2020-03-23
得票数 1
1
回答
“决策树”/“随机森林”算法
中
的
二进制编码
、
、
、
在
包含基数很高
的
分类
列
的
数据集中使用二进制编码可以吗?关于我
的
数据集
的
一些事实:其中一个范畴
变量
具有1,700个唯一值。作为一个领域专家,我确信那些基数较高
的
分类
列
是强有力<em
浏览 0
提问于2018-10-03
得票数 3
1
回答
在
R
中
创建
新
变量
我有两个
变量
TEMPD和ENERGYtempd2 = tempd^2;有什么想法吗?
浏览 0
提问于2012-11-11
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券