在R中的新变量列中创建新的分类变量级别

文章/答案/技术大牛

发布

2回答

、

我是newbee to R，所以被困在这里..我有一个明确的数据 levels(df$SO) "SO1", "SO2","SO3","SO4","SO5","SO6",SO7",SO8" 我想将这些级别重新分类，如下所示，但将它们保存为同一DATAFRAME中的新列(df$newSO)。我正在使用下面的代码 lev

浏览 12提问于2020-03-25得票数 1

2回答

基于条件将不同的虚拟变量组合成单个分类变量(互斥类别)？

、

我是R的新手，正在尝试创建一个基于三个虚拟变量的新变量，使之成为具有4个级别(0,1,2,3)的单个分类变量，其中应该包含相互排斥的类别。这里有一些我想要的输出的规格。如果g_kom = 0，则新变量的值应为0。如果g_kom = 1，则新变量的<

浏览 28提问于2021-02-10得票数 0

回答已采纳

1回答

SQL Server R Services中使用lm-模型进行预测时的“因子有新水平”错误

、、、

我是R方面的新手，但试图将它与一起使用。print(coef(model));' @language =N'R'中的错误(术语、新<

浏览 1提问于2018-04-19得票数 1

3回答

如何去除R中的一个因子级？

、

我需要将变量从R中的数据帧中删除，我的数据有一列有18个因素： drop if rama1 == 99 (rama1是因

浏览 1提问于2015-08-30得票数 1

回答已采纳

2回答

Linq to SQL:只对具有空值的字段加载默认值

、、

我将Linq到-SQL用于获取记录名为的表，而Record有一个名为Level的列，其默认值通过数据库声明定义为-1。我希望我的C#应用程序像这样插入分类类型的新记录R：如果定义了变量R的字段级别(NULL)：使用此字段的值进行

浏览 12提问于2013-11-15得票数 0

回答已采纳

1回答

R中一个单元格中具有多个值的变量分类

我是新的编码在R和张贴在这里，所以请告诉我，如果我可以添加任何有用的东西。我试图创建一个新的分类变量“收入”(3级)，将预定国家的子集(x，y，z)分类为不同的级别。我的问题是，countries变量在每个单元格中有多个国家，所以我不知道如何分类。HMIC 3

浏览 4提问于2022-07-20得票数 2

7回答

如何折叠类别或重新分类变量？

、、

在R中，我有600,000个分类变量，每个变量都被分类为"0“、"1”或"2“。我想要做的是折叠"1“和"2”，并保留"0“本身，这样在重新分类"0”=“0”之后；"1“= "1”和"2“= "1”。最后，我只想让"0“和"1”作为每个变量的类别。此外，

浏览 4提问于2010-07-17得票数 7

回答已采纳

1回答

PySpark:我们应该迭代更新数据吗？

、、、

我的问题有两部分。第一种是了解火花的工作方式，第二种是优化。我有一个火花数据，它有多个分类变量。对于这些分类变量中的每一个，我将添加一个新列，其中每一行都是相应级别的频率。)，我要添加一个新变量Freq_State。级别NY在dataset中显示4500时间，因此该行将在Freq_State列</em

浏览 1提问于2018-04-19得票数 2

9回答

从分类变量创建新的虚拟变量列

我有一个包含75,000个观察值的多个数据集和一个可以取值为0-4的type变量。我想为所有类型的每个数据集添加五个新的虚拟变量。我能想到的最好的方法是：binom.dummy.listbinom.dummy.df<-transform(binom

浏览 2提问于2010-08-02得票数 39

回答已采纳

2回答

如何将我的数值数据绑定到具有两个级别的分类变量中

我目前有一个包含从0到3000的大范围数字数据的数值列( variable $numberseen)，但我想将其转换为一个具有两个级别的新分类变量:存在(number > 0)和缺席(number seen我该如何创建它？

浏览 8提问于2020-04-10得票数 0

回答已采纳

5回答

使用ifelse进行分类

、

我有一个很大的数据集，我希望在其中创建一个新列，用于重命名现有列中的分类变量。现有列(称为"Side")中的三个可能值是'l‘、'r’和'c‘。在新的列中，我希望将现有列中标记为'l‘的</

浏览 1提问于2020-08-28得票数 1

2回答

使用R根据变量创建聚合列

、、、

如果这是一个菜鸟问题，我很抱歉，但我在论坛上看了看，找不到一种方法来搜索我想要做的事情。我有一个训练集，我正在试图找到一种方法来减少我的分类变量的级别数量(在下面的示例中，类别是状态)。一旦输入到数据框中，我的训练集将如下所示：1 CA 1 03 NY 00 0 7 AZ

浏览 0提问于2012-01-05得票数 1

回答已采纳

1回答

Python :理解分类变量的d树输出

、、、、

数据集具有所有的分类特性，与R不同，Python需要对分类变量进行虚拟编码。我使用以下代码对所有分类变量执行虚拟编码：df_with_dummies = pd.get_dummies(df2, columns = col_names) 虚拟编码根据每个列的因素数创建<

浏览 1提问于2017-07-02得票数 0

回答已采纳

1回答

计算pyspark Dataframe中的列数？

、、、

我有一个有15列的数据帧(4列是分类的，其余的是数字的)。print type(df.printSchema()) 

浏览 10提问于2017-03-15得票数 5

回答已采纳

2回答

R-基于freq表变量的级别创建新列

嗨，我是新来的，所以请耐心听我说， Length Seq X 29 GTGCACCGCAAGTGCTTCTAAGAAGGATC 19 count(dF, vars=c("Length", "X")) 要生成一个如下所示的freq198 410 104

浏览 4提问于2015-04-24得票数 1

1回答

从拟合的lm或glm [R]中获取每个因子级别(以及交互作用)中的数据数量

、、、、

我在R中有一个逻辑回归模型，其中所有的预测变量都是分类的，而不是连续的(除了响应变量，它显然也是分类/二元的)。在调用summary(model_name)时，有没有办法在每个因子级别中包含一个表示观察值数量的列？

浏览 73提问于2018-07-19得票数 2

回答已采纳

1回答

取将由一组分类变量分组的大量变量的平均值

我有500列。一个是3个类别的分类变量，其余是连续变量。这些列下面有50行。我如何通过分类变量对数据帧进行分组，并对每一列中具有该DF的连续变量的每一类中的观察值取平均值？另外，删除所有NA。我想根据此信息创建一张新CD。最好的，亨利

浏览 6提问于2020-04-08得票数 0

回答已采纳

1回答

如何对列中的字符串数据进行编码，以便应用机器学习技术进行分类，例如k-means？

、、、、

我在一个具有各自ID (RangekksId)的列中有字符串变量(RangeVarName)。我需要创建一个算法，将新的变量分类到现有的ID，或者如果不可能，将它们单独放在N/A类中。 ? 如何对列中的字符串数据进行编码，以便应用机器学习技术进行分类，例如k-means？

浏览 34提问于2020-03-23得票数 1

1回答

“决策树”/“随机森林”算法中的二进制编码

、、、

在包含基数很高的分类列的数据集中使用二进制编码可以吗？关于我的数据集的一些事实：其中一个范畴变量具有1,700个唯一值。作为一个领域专家，我确信那些基数较高的分类列是强有力<em

浏览 0提问于2018-10-03得票数 3

1回答

在R中创建新变量

我有两个变量TEMPD和ENERGYtempd2 = tempd^2;有什么想法吗？

浏览 0提问于2012-11-11得票数 0

回答已采纳

点击加载更多