腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
基于
数据
帧
因子
元
数据
的
级别
创建
二进制
编码
列
我想
创建
因子
列
的
“
二进制
编码
列
”。有各种各样
的
代码,它们很好地工作于具有许多行
的
数据
帧
(即,每个
级别
至少有一行)。我
的
用例是,在
数据
框中,我可能只将
因子
级别
作为“
元
数据
”。因此,给出一个这样
的
数据
帧
: haves <
浏览 15
提问于2020-09-02
得票数 1
回答已采纳
1
回答
R-汇总每
列
的
因子
级别
计数
、
、
、
、
我有一个
数据
帧
,其中包含许多
列
,这些
列
都
编码
为
因子
变量。每一
列
都是
基于
只有两个选项
的
问题: 1=yes和2=no,或者缺少。每一行都是一个参与者。这里是一个简化
的
版本: Q_1 Q_2 Q_3 2 1 1 2 1 2 理想情况下,我希望
创建
一个概述
数据
框架,其中每个问题作为行,以及每个因素
浏览 27
提问于2021-09-15
得票数 0
1
回答
对于决策树,我应该将
二进制
因子
变量
编码
为0还是1?
、
我正在构建一棵决策树,我有一堆
二进制
变量,我将它们
编码
为
因子
。 它们每个都有两个
级别
,第一个
级别
是“有属性”,第二个
级别
是“没有属性”。该属性被替换为
列
的
名称,如"has blue rose pedals“ 这是我正在应用我
的
数据
的
模型,使用iris作为示例代码 library(rpart)par(xpd
浏览 4
提问于2020-10-07
得票数 0
回答已采纳
3
回答
如何去除R中
的
一个
因子
级?
、
我需要将变量从R中
的
数据
帧
中删除,我
的
数据
有一
列
有18个因素: drop if rama1 == 99然后,为了在Stata中
创建
浏览 1
提问于2015-08-30
得票数 1
回答已采纳
2
回答
Xgboost -如果整数仅为0和1,我们是否必须将它们转换为
因子
、
、
我在一个
数据
帧
中有许多
列
,它们是标志"0“和"1”。当我导入
数据
帧
时,它们属于"integer“类。我需要将它们转换为
因子
吗?
因子
将成为
级别
1和2,而目前它们几乎是相似的0和1,尽管是整数 我计划稍后使用xgboost来构建一个预测模型。Xgboost只适用于数字
列
,所以如果我将
列
转换为factor
的
列<
浏览 38
提问于2017-02-19
得票数 1
回答已采纳
1
回答
在没有
数据
的
情况下跟踪因素水平
、
免责声明:这个项目最初是以其他人
的
代码开始
的
,我相信会有一些非优化
的
设计决策,但我
的
手比我自己
的
项目要紧一些。我有一个机器学习算法,它使用一个经过训练
的
模型对象,并结合一组评分
数据
来
创建
一个得分
数据
的
数据
框架。模型对象是一个具有公式和
数据
框架
的
列表。模型
数据
框架
的
作用之一是确保评分
数据
框架
的
<
浏览 6
提问于2012-08-23
得票数 2
2
回答
对于每个观测结果,在由
因子
确定
的
子集上找到相应
的
厘米。
假设我有这样一个
数据
框架:我想要
创建
一个新
的
列
,它将包含一个观察属于
的
厘米,在每个
因子
级别
上分别计算。怎样才是一种相当简单和有效
的
方法来做到这一点?))$df[, "f"]) 然而,这只是给了所有观察
的<
浏览 1
提问于2017-05-31
得票数 0
回答已采纳
1
回答
基于
从特定字符或字符串开始
的
因素
级别
的子集
数据
帧
、
、
、
我正在尝试根据一个
因子
(这里是ID)对
数据
帧
进行子集。我想要
的
是
基于
因子
级别
的子集,从一个特定
的
字符开始。下面是一个
数据
帧
示例: ID = c("100", "100a", "101", "103", "204", "206", "207", "207a",
浏览 1
提问于2017-08-02
得票数 3
1
回答
关于R中
的
食谱包
、
您好,我正在机器学习模型中使用功能工程
的
食谱。然而,当我使用step_dummy时,伪变量被视为数值变量,而不是
因子
。我认为当我们使用随机森林或其他树模型时,这可能是有问题
的
。所以X轴有0.25,0.5......这应该只有0和1(因为是虚拟
的
)。
浏览 7
提问于2020-02-29
得票数 1
1
回答
R: mapply函数返回错误:
因子
的
级别
集不同
、
我有两个
数据
帧
(DfA和DfB)。每个
数据
帧
有三个
因子
变量:种类、类型和区域。DfA还有一个数值
列
,我想使用它来根据共享属性估计DfB
的
一个新
列
中
的
数值。我有一个函数,它询问物种、类型和地区,然后使用这些属性
创建
DfA
的
子集,并在子集上运行算法来估计新值。当我运行该函数并手动指定这些值作为测试时,它工作得很好。如果DfB中
的
所有
因子
级别
和组合在D
浏览 1
提问于2014-03-29
得票数 0
1
回答
将grepl转换为函数
、
、
这个想法非常简单:识别data.frame
的
级别
,提取具有特定
级别
的所有行,并将其写入新
的
data.frame。 所以一个非常糟糕
的
解决方案应该是这样
的
。
浏览 0
提问于2018-06-03
得票数 0
1
回答
为什么在cassandra中我们需要键空间级
的
复制
因子
,为什么不需要
列
家族级
的
复制
因子
?
、
为什么在cassandra中我们需要关键空间级
的
复制
因子
?为什么不在
列
家庭层面?
浏览 4
提问于2014-02-02
得票数 1
回答已采纳
1
回答
按
列
索引划分为
数据
帧
列表
、
在基数R中是否有一种简单
的
方法,可以根据索引
因子
级别
(从另一个
数据
帧
中提取)将
数据
帧
拆分为
数据
帧
列表?(num1 = 1:26, let = letters, num2 = 10:35, LET = LETTERS)但是,假设我们有一个指示
列
的
因子
级别
的索引
浏览 2
提问于2018-08-22
得票数 2
回答已采纳
2
回答
以整数
的
形式从dataframe获取
因子
的
级别
考虑到,我知道:gender <- factor(c("male", "female", "female", "male"))levels(gender) "female" "male我
的
问题是,如何才能完全
基于
数据
帧
的
元
数据
浏览 2
提问于2020-09-02
得票数 3
回答已采纳
1
回答
如何在具有不同
因子
级别
的不同
数据
帧
中使用Forcats::Fct_Collapse
、
、
library(tidyverse)我有两个简单
的
数据
帧
(底部
的
代码),我想通过折叠"Animal“
列
来
创建
一个新
的
重新
编码
的
变量。但是,我想
创建
一个函数,将fct_collapse应用于许多具有相同变量
的
不同
数据
帧
,只是有些
数据
帧
可能缺少一个或两个
因子
级别
浏览 3
提问于2018-02-02
得票数 1
回答已采纳
2
回答
防止因素等级
的
排序
、
当我提取R中
数据
帧
列
的
因子
级别
时,它们会自动排序(按字母顺序排列)。我怎么才能阻止这一切?也就是说,我希望
级别
的顺序与
数据
帧
列
中
的
顺序相同。data.frame(Names = c("Paul McCartney", "John Lennon")) -> my.data “约翰
列
侬”“保罗M
浏览 3
提问于2013-06-03
得票数 4
回答已采纳
1
回答
包含空值
的
分类
数据
到R
因子
的
Rpy2转换
、
、
、
、
我有一个pandas
数据
帧
,它有一个包含NaN值
的
分类
列
,例如:g 2 Cdtype: category在pandas中,NaN不是一个类别,但您可以在分类
数据
中包含我想在Jupyter笔记本
浏览 2
提问于2018-11-15
得票数 0
1
回答
R:混合
数据
类型
的
数据
帧
的
类型转换
、
、
我一般都喜欢R,但是类型转换
的
问题让我发疯了。我从
数据
库连接中读取
数据
帧
。结果是一个带有字符
列
的
数据
帧
。 我知道第一
列
是日期格式,其他
的
都是数字格式。然而,无论我如何尝试将
数据
帧
的
字符
列
转换为正确
的
类型,它都没有成功。当将
数据
帧
转换为矩阵,然后返回到
数据
框架时,
浏览 1
提问于2016-08-12
得票数 1
回答已采纳
1
回答
根据
列
的
因子
级别
自动
创建
数据
帧
、
我有一些带有经理id、类型和位置
的
假案例
数据
。我想要自动
创建
数据
帧
,其中包含管理人员在给定位置
的
平均案例数。type <- data.frame(type)df <- cbind(manager_id, type, location)total <
浏览 3
提问于2021-12-17
得票数 0
回答已采纳
2
回答
是否有一种方法可以在一行中
创建
多个因素
级别
的新df特性?
是否有一种方法可以将依赖于现有
列
的
多个因素
级别
的
列
添加到一行中
的
数据
帧
中?如果新列有两个
因子
级别
和两个以上
的
因子
级别
,那么答案会改变吗?mtcars df$mpg_rating[df$mpg>20] <- "ok" df$mpg_rating[df$mpg>30] <
浏览 0
提问于2019-03-29
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Hive底层数据存储格式详解
Scikit-Learn大变化:合并Pandas
机器学习中的独热编码
简易指南带你启动 R 语言学习之旅
IJCAI 2018:浙江大学:基于多通道层级聚焦网络的多轮视频问答
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券