Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >用r实现一次热编码

问用r实现一次热编码
EN

Stack Overflow用户

提问于 2019-02-04 02:28:06

回答 1查看 111关注 0票数 1

对于我正在处理的数据集，有很多字符变量是我想要的--对它们进行热编码，以便建立一些预测模型。在我的代码中，我排除了两个变量，因为对它们进行编码是没有意义的，它们是存储的项目标识符和建立年份。下面是我使用的代码：

one_hot_encoding = dummyVars("~.", data = train[,- 
c("Item_Identifier", "Outlet_Establishment_Year")], fullRank = T)
ohe_df = data.table(predict(one_hot_encoding, train[,- 
c("Item_Identifier", "Outlet_Establishment_Year")]))
train = cbind(train[,"Item_Identifier"], ohe_df)

执行第一行时会出现以下错误：

-c中的错误(“Item_Identifier”，"Outlet_Establishment_Year")：对一元运算符的无效参数。

为什么？还有一个关于dummyVars函数的问题:默认情况下，它是否排除了输入数据集的数值变量？

one-hot-encoding

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-02-04 02:47:08

是的，默认情况下它不包括数值变量。

纠正您的错误，有一些解决办法：

与dplyr-package select(train, -Item_Identifier, -Outlet_Establishment_Year)
带着基-R train[, -which(names(train) %in% c("Item_Identifier", "Outlet_Establishment_Year")] 或者只需使用列的编号，如 train[, -c(1,6)]

票数 1

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/54514208

复制

相关文章

单片机 https 网络安全

独热编码（One-Hot Encoding），又称为一位有效编码，主要是采用位状态寄存器来对每个状态进行编码，每个状态都有他独立的寄存器位，并且在任意时候只有一位有效。

水煮麥楽雞

2022/11/20

1.3K0

「R」用purrr实现迭代

for循环 map mean null purrr

除了函数，减少重复代码的另一种工具是迭代，它的作用在于可以对多个输入执行同一种处理，比如对多个列或多个数据集进行同样的操作。

王诗翔呀

2020/07/03

4.8K0

用预测编码实现因果推断

编码框架模型数据网络

贝叶斯和因果推理是智能的基本过程。贝叶斯推理模型观察:如果我们观察一个相关变量x，可以推断出关于y的什么？因果推理模型干预:如果我们直接改变x，y会如何改变？预测编码是一种受神经科学启发的方法，仅使用局部信息对连续状态变量进行贝叶斯推理。在这项工作中，我们超越了贝叶斯推理，并显示了在因果图已知的情况下，预测编码的推理过程中的简单变化如何实现干预和反事实推理。然后，我们扩展我们的结果，并显示如何预测编码可以推广到的情况下，这个图是未知的，必须从数据推断，因此执行因果发现。其结果是一种新颖而简单的技术，允许我们对基于预测编码的结构因果模型进行端到端的因果推理，并展示其在机器学习中潜在应用的效用。

CreateAMind

2023/09/26

3050

LabelEncoder（标签编码）与One—Hot（独热编码）

机器学习神经网络深度学习人工智能编程算法

在做Kaggle项目的时候，碰到的问题，通常拿到一个比赛项目，将特征分为数字型特征和文字性特征，分别进行处理，而对于文字型特征如何处理，这时就需要用LabelEncoder（标签编码）和One—Hot（独热编码）将其转换为相应的数字型特征，再进行相应的处理。首先了解机器学习中的特征类别：连续型特征和离散型特征

用户5745385

2019/07/04

9.9K0

LabelEncoder（标签编码）与One—Hot（独热编码）

R绘图|时间热图

data na 基础数据优化

在徐凌老师的 Nat Com 文章 Genome-resolved metagenomics reveals role of iron metabolism in drought-induced rhizosphere microbiome dynamics 中有这么一张补充图，介绍了本研究中涉及到的处理和取样的时间线。

小汪Waud

2023/10/24

2180

R 热图绘制heatmap①

R.package heatmap():用于绘制简单热图的函数 heatmap.2():绘制增强热图的函数 d3heatmap:用于绘制交互式热图的R包 ComplexHeatmap:用于绘制、注释和排列复杂热图的R&bioconductor包（非常适用于基因组数据分析）首先使用ggplot2画简单热图 data <- as.data.frame(matrix(rnorm(9*10),9,10)) rownames(data) <- paste("Gene", 1:9, sep="_") colnam

用户1359560

2018/08/27

1.1K0

怎样用Python实现地理编码

怎样用Python实现地理编码专栏作者：时空Drei ❈ 时空Drei，德国德累斯顿工业大学在读博士生，个人的擅长领域为：利用Python进行空间数据（遥感GIS）处理分析，掌握常用的机器学习工具。个人公众号：stdrei，分享时空数据分析与德国留学笔记。 ❈ 引言今天看到一篇阿里云的文章"天下武功，唯快不破"，以物流行业为例，分析了PostgreSQL 与 Greenplum 在地理位置信息处理，最佳路径算法，机器学习等方面的物流行业应用方法。其中提到了地址转换成坐标的问题，更专业些的名词应该是“地

Python中文社区

2018/01/31

3.2K0

怎样用Python实现地理编码

R 热图绘制heatmap②

使用pheatmap包绘制热图一般而言，pheatmap较heatmap.2等更为简洁以及易于理解，对于初学者而言是一款不错的热图绘制软件。 rm(list=ls()) setwd("E:\\Rwork") library(pheatmap) #创建数据集test测试矩阵 test = matrix(rnorm(400), 20, 20) colnames(test) <- paste("sample",1:20,sep = "") rownames(test) <- paste("ge

用户1359560

2018/08/27

1.4K0

R语言绘制大热图

大热图一般是高水平SCI的标准配置，可以迅速提高文章的送审和接受率。

用户1359560

2019/09/30

1.2K0

编码、R 与 Windows （一）

windows ascii unicode 编程算法

本期大猫将开个新帖介绍R中的编码问题。就像导言中说的，编码是一个常常被忽视的“小问题”——直到他给你造成成吨的伤害Orz。它尤其频繁出现于数据传输中，例如你在澳大利亚的机器上建立的SAS数据集死活没法在中国的SAS中打开，或是R 操作台打印中文总是乱码等等（关于中文编码请阅读大猫上一期《我知道你不知道GB2312》）。大猫新开这个系列的目的就是帮助大家在最短时间搞明白你所要知道的关于编码的一切。最重要的是，这篇文章不会过于详细的探讨这些编码背后的原理，而是明确告诉大家在什么样的时候应该用什么样的编码（相信这是大家最希望了解的）。至于这些编码背后的复杂原理以及历史，大猫会在最后放上链接，有兴趣的小伙伴可以自行阅读。由于尽量追求通俗易懂，下面内容可能无法在技术上保证100%的严谨，但是大猫保证，以下95%的论述都是正确的！

用户7652506

2020/10/23

1.1K0

编码、R 与 Windows （一）

详解深度学习中的独热编码

深度学习数据处理 tensorflow

很多人开始接触深度学习，数据处理遇到第一个专业英文术语就是one-hot encode(独热编码)，很多初学者就会迷茫，这个东西是什么意思，其实说的直白点所谓的独热编码最重要的就是把一组字符串或者数字转为一组向量而且这组向量中只能有一个向量值是1。可见独热编码还是很形象的说1这个单独大热门，做个形象的比喻，2018足球世界杯的冠军只能有一个，如果对32支球队做个独热编码则会得到32个向量，其中只能有一支球队对应的向量是1，表示这届的冠军就是它啦，其它都只能是零，得回家。对以往各届参赛球队做独热编码就可以得到每届结果，然后根据以往各支球队综合表现生成一系列的向量，就可以训练生成模型，根据本届各队综合表现参数，就可以预测本届冠军啦，这里独热编码生成的向量可以作为标签，这个也是独热编码最常用的方式与场景。在tensorflow的官方mnist数据集例子中也是采用独热编码来做标签数据，训练实现手写数字识别的。说了这么多独热编码的解释与概念，下面就来看看独热编码详细解释，只需四步，保证你理解独热编码，而且会做啦。

OpenCV学堂

2018/07/26

1.6K0

R语言学习 - 热图美化

机器学习 r 语言

热图美化上一期的绘图命令中，最后一行的操作抹去了之前设定的横轴标记的旋转，最后出来的图比较难看。上次我们是这么写的 p <- p + xlab("samples") + theme_bw() + theme(panel.grid.major = element_blank()) + theme(legend.key=element_blank()) 为了使横轴旋转45度，需要把这句话theme(axis.text.x=element_text(angle=45,hjust=1, vjust=1))放在

生信宝典

2018/02/05

2.6K0

用线性回归无编码实现文章浏览数预测

线性回归编程算法 sql

继无编码利用协同算法实现个性化推荐,我纯粹使用SQL和配置实现了一个更为复杂一些的，计算文章词汇的tf/idf值，将浏览数作为预测值，使用线性回归算法进行模型训练的示例。帮助大家更好的了解StreamingPro对算法的优秀支持。这篇文章的示例将会跑在Spark 2.0 上了。为了方便大家体验，我已经将Spark 安装包，StreamignPro,以及分词包都准备好，大家下载即可。

用户2936994

2018/08/27

5130

R语言绘制地图热图

1. https://www.cnblogs.com/lonelyxmas/p/5722260.html

一粒沙

2019/07/31

6.3K1

【R语言】热图绘制-heatmap函数

r 语言数据库 sql https 网络安全

其实每一张热图后面都对应一个表达矩阵。如上图所示，每一行是一个基因，每一列是一个样本。每一个小的色块，就是这个基因在这个样本中的表达量。只是这里用颜色的深浅来表示基因表达值的高低而已，颜色越红，表达值越高。颜色越蓝表达值越低。

生信交流平台

2022/09/21

2.4K0

【R语言】热图绘制-heatmap函数

R语言学习 - 热图简化

机器学习 r 语言

热图绘制 - pheatmap 绘制热图除了使用ggplot2，还可以有其它的包或函数，比如pheatmap::pheatmap (pheatmap包中的pheatmap函数)、gplots::heatmap.2等。相比于ggplot2作heatmap, pheatmap会更为简单一些，一个函数设置不同的参数，可以完成行列聚类、行列注释、Z-score计算、颜色自定义等。那我们来看看效果怎样。 data_ori <- "Grp_1;Grp_2;Grp_3;Grp_4;Grp_5 a;6.6;20.9;10

生信宝典

2018/02/05

2.8K0

用ECMAScript4 ( ActionScript3) 实现Unity的热更新 -- 热更新Live2D

ecmascript actionscript

总得来说，我们可以先去live2D官网下载它的Unity SDK,然后即可在Unity中使用。我们这里使用的是live2d 2.1版。

用户1687945

2018/12/24

9230

R语言复杂热图的绘制

大家对热图应该都不陌生，但是混合的复杂热图在我们的应用中并不是太多见。今天给大家介绍一个绘制复杂热图的R包ComplexHeatmap。

一粒沙

2019/07/31

3K0

在Leaflet如何画热图-R

在绘制地图时候，我们经常会用到热图，Density map，在ggplot2中可根据坐标产生相应的密度图，2d distribution，那么在交互式地图中，如何制作Density Map，

Jamesjin63

2022/10/25

2K0

在Leaflet如何画热图-R

点击加载更多

相似问题

用python实现一次热编码的快速方法

113

用Pandas执行一次热编码

23

单热编码R

13

如何在R中进行一次热编码

22

大数据帧R中的一次热编码

11

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例