如何将也满足R中另一个标准的分类变量分组？DPLYR？_如何使用Dplyr对R中的代码进行调试，以获得分组变量的标准差？ - 腾讯云开发者社区

、、、

我正在与R光泽进行一些探索性的数据分析。我有两个复选框输入，其中只包含用户选择的选项。第一个复选框输入仅包含分类变量；第二个复选框仅包含数字变量。接下来，我对这两种选择应用groupby： var1 <- input$variable1 # Checkbox with categorical variables var2 <- input$variable2 # Checkbox with numerical variables v$data <- dataset %>% group_by_(var1) %>% summarize_(

浏览 3提问于2015-12-28得票数 45

回答已采纳

2回答

根据另一个数据帧中的值更改新列

、

我有一个数据框架，其中包含人员的id和他们来自哪里以及其他列。 id Country x 1 usa x1 2 uk x2 3 usa x3 4 che x4 和另一个包含国家代码及其收入分类的数据帧 Country income usa upper middle uk high che low 我想在第一个dataframe中创建一个新列，列出每个人的国家分类，这样我就拥有： id Country x CountryIncome 1 usa x1 upper middle 2 uk x2 hig

浏览 0提问于2021-07-30得票数 0

1回答

存储因子变量最大值和最大值的匹配观察值

、

我很好奇如何在R中创建另一个数据集，它将存储因子变量的最大值并匹配该最大值的观察值。这是一个只有4个主题和一个代码的数据集片段： library(data.table) my.data <- structure(list(Subject = c(1L, 1L, 1L, 1L, 2L, 2L, 3L, 3L, 3L, 4L, 4L, 4L, 4L), Supervisor = structure(c(2L, 2L, 2L, 2L, 2L, 2L, 1L, 1L, 1L, 1L, 1L, 1L, 1L), .Label = c("Emmi", "Pauli"

浏览 1提问于2016-11-25得票数 0

1回答

解释e 1071:r中naiveBayes分类器返回的条件概率

、

使用以下过程处理分类解决方案： a.使用e1071在R中执行朴素贝叶斯分类。 b.获取先验表和条件概率表。 c.在应用程序中使用PL/SQL程序来预测值。也就是说，最终预测不会涉及R预测函数的使用。在步骤b中，我看到模型生成后R返回的条件概率是负的，并且大于1--它们真的是条件概率吗？用两个数据集来说明这个问题--一个是我能解释的，一个是我无法解释的。数据集1:水果识别(在这个论坛中的一个漂亮的朴素贝叶斯插图中看到了这一点) Data Frame Fruit_All: Long Sweet Yellow Fruit Yes Yes Yes Banana Yes Yes

浏览 4提问于2016-06-17得票数 3

回答已采纳

1回答

R studio中的频率/计数变量

、、

长期潜伏的人，通常使用SPSS/graphpad进行统计，懒惰但肯定地努力学习如何使用R studio。在SPSS中，我有一个包含三个变量的数据集:保险(分类，4级)；npo_violation (分类，2级)和频率(规模，这表示例如，医疗补助违反非营利组织的频率)。example dataset in SPSS 我正在尝试将这个带有频率计数变量的数据集带到r-studio中，这样我就可以根据组合的百分比制作分组条形图。我已经使用了foreign/haven/Hmisc将它带到了r studio中，也是我自己创建的 df_sample <- data.frame(insurance

浏览 28提问于2020-06-11得票数 1

回答已采纳

1回答

如何在R中将每日数据转换为每周数据

、

我有每日设备曝光数据，我想将其转换为每周数据。我知道以前有人问过这个问题，但我想不通，因为我对R很陌生。如何将其转换为按县代码的周计数(共有88个)，并按周对设备曝光量、县内设备总数、调整后的曝光量和调整后的设备总数求和？

浏览 0提问于2020-10-25得票数 0

2回答

将分类数据转换为数值

、

我有一个有大量分类和数字混合的数据集。我试图对肥胖进行回归，我试图包括的变量是状态、年龄、性别，例如，我有一个问题，询问被访者在过去30天中是否锻炼过，答案是1=是，2=不，7=不确定/不知道，空白=没有答案或缺失。如何将此数据集设置为正确的窗体以在回归中运行？或者换句话说，如何创建一个更小的dataframe，包括我从非常大的dataframe中只需要的变量？下面是我需要的数据的前10行：在50个州中，我只试着使用三个特定的州，我如何过滤，这样我就可以使用来自三个州的数据(每个州都有一个代码，例如kentucky=21，colorado=8，纽约= 36)。

浏览 4提问于2022-04-19得票数 0

1回答

取将由一组分类变量分组的大量变量的平均值

我有500列。一个是3个类别的分类变量，其余是连续变量。这些列下面有50行。我如何通过分类变量对数据帧进行分组，并对每一列中具有该DF的连续变量的每一类中的观察值取平均值？另外，删除所有NA。我想根据此信息创建一张新CD。最好的，亨利

浏览 6提问于2020-04-08得票数 0

回答已采纳

2回答

ddply与列计数

、

我是R的新手，并根据这里关于StackOverflow的其他有用建议拼凑了下面的语法。我试图将名为“合并时数”的列和起来，并得到名为DOC_LINE_NUM的列的计数(按列DOC_NUM分组)。因此，对于每个DOC_NUM，计算一个和COMBINED_HOURS，并显示一个DOC_LINE_NUM计数。下面的语法可以很好地获得COMBINED_HOURS的列和，但是如何将计数逻辑合并到DOC_LINE_NUM的这个语法中呢？谢谢。 train2 <- ddply(train, c("WEEKNUM", "DOC_NUM", "DOC_LINE

浏览 1提问于2015-10-31得票数 0

回答已采纳

2回答

R:计算每个类别的观察次数

、、、

我目前从R开始，想知道如何从下面的数据集中计算每天每个节点每个复制的观察次数，并将其存储在不同的数据集中。原始数据集如下所示： 📷 希望生成的数据集如下所示： 📷 有人能帮我找出我怎么能在R里做到这一点吗？谢谢

浏览 0提问于2020-07-02得票数 1

1回答

在R中的聚合后选择其他行元素

、

我想在每一组中选出最年轻的人，并按性别进行分类。这是我的初步数据 data1 ID Age Gender Group 1 A01 25 m a 2 A02 35 f b 3 B03 45 m b 4 C99 50 m b 5 F05 60 f a 6 X05 65 f a 我想要这个 Gender Group Age ID m a 25 A01 f a 60 F05 m

浏览 1提问于2015-11-27得票数 0

回答已采纳

2回答

只输出数据帧中的数字变量或分类变量

我想要创建一个2个数据框架从‘逮捕’，第一个只包括变量与数值，另一个只包括分类变量。例如： X <- data.frame(Arrests) X released colour year age sex employed citizen checks 1 Yes White 2002 21 Male Yes Yes 3 2 No Black 1999 17 Male Yes Yes 3 3 Yes White 2000 24 Male

浏览 0提问于2018-05-07得票数 0

回答已采纳

1回答

dplyr组不工作在闪闪发光

、、、

我正在使用R闪亮的应用程序，因为我有两个下拉框。第一个下拉列表是由分类变量填充的，第二个是由数值变量填充的。然后我在范畴变量上应用groupby。这是我的密码。 dataset<- dataUpload() var1 <- as.character(input$variable1) var2 <- as.character(input$variable2) v$data <- dataset %>% group_by(dataset[,var1]) %>% summarize(Sum=sum(dataset[,var2])) %>% a

浏览 4提问于2015-12-27得票数 5

回答已采纳

2回答

如何使用R中的dplyr对基于组和子组的行进行求和？

、

我的dataframe有两个分类变量，其中一个的层次比另一个低。我想用dplyr求和子类别中所有行的数值。提前感谢所有能帮助我的人！这是我开始使用的数据格式： transportation <- data.frame( Country = c("A", "A", "A", "B", "B", "B"), Mode = c("Car", "Train", "Plane", "Car", "Train",

浏览 12提问于2022-04-19得票数 1

回答已采纳

1回答

R将小时数据转换为每日数据，但保留分类数据。

我目前的小时数据比我已经转换为每日如下。 n <- 24 daily <- aggregate(day[,-1], by = list(gl(ceiling(nrow(day[,-1])/n), n)[1:nrow(day[,-1])]), FUN = mean) 然而，我有2列的分类数据，我想保留R。现在，在这些专栏中，每一天都有24个夏天，然后是24个星期一，等等。我该如何保持只有夏天和星期一的观测1，然后夏天和星期二的观察2等等。谢谢。

浏览 1提问于2021-07-02得票数 0

回答已采纳

1回答

R检查多变量中的异常值

、、

我需要检查我的数据的异常值，我有67个不同的变量。所以我不想用手来做。这是我手动检查的代码(我有三个要检查的因素- voiceID，gender和VP)。但我不知道该如何将其更改为遍历列的循环。 features %>% group_by(voiceID, gender, VP) %>% identify_outliers(meanF0) 这些值都是数字。输出应该告诉我哪些因素的哪些行是异常值。感谢你的帮助

浏览 0提问于2020-07-14得票数 0

1回答

R data.frame中的数据分组

、

什么是按相当于R的sql组，例如，我希望在data.frame上执行此操作 SELECT MAX(temp) from table group by day 按子集函数注：我知道sqldf，我不想把它用作什么用途

浏览 0提问于2015-09-27得票数 0

回答已采纳

1回答

如何对数据帧中的特定数据组执行变异函数(ddply)？

、

我试图使用ddply mutate函数将1添加到数据帧的特定行中。特定问题当Duration是experimenterTalk时，如何将1添加到experimenterTalk(参见下面的示例数据框架中的第9行)？以下是我的数据帧的前几行。此数据帧的名称为data_all。 Time Duration trackName Comment (int) (dbl) (fctr) (fctr) 1 10173 0.500 playingCaterpillar (null) 2 11092

浏览 3提问于2015-12-10得票数 0

回答已采纳

1回答

使用R中的is.na()和if_else()将连续数据记录为分类数据

、、、

我有一个数据框架，其中一个列包含连续数据和NA。我希望使用if_else()和is.na()将所有连续数据重新编码为一个级别的分类数据，将NA重新编码为另一个级别。我该怎么做呢？示例数据框架： df<-tibble(id=1:10,score=c(3,1,-3,-9,NA,NA,12,NA,5,NA)) 如何将所有数字重新编码为“结果”，将NA重新编码为"no_results"？

浏览 4提问于2022-01-24得票数 -2

回答已采纳

2回答

如何在R中创建多个循环？

、

我正在使用一个国家的每日死亡人数数据库，因此我需要创建一个数据库，其中包含按日、月和州划分的每日死亡人数的汇总数据。我的数据库(def_2020)是这样的： |--------------|------------|-------| | State | Month | Day | |--------------|------------|-------| | state1 | jan | 1 | |--------------|------------|-------| | state1 | jan |

浏览 20提问于2020-11-17得票数 0

回答已采纳

1回答

多标签分类完成了，对吗？

、、

假设我有一个数据集，可以使用weka的J48或R中的randomForest对其进行整齐的分类。现在假设我有另一个训练文件，每个数据点包含两个分类。我如何将这两者结合起来，才能将新的数据点分类到这两个类别中？ (所以我需要一个“两关”的培训。) 我是否应该使用MLP (就像受限的玻尔兹曼机)？

浏览 2提问于2011-02-15得票数 0

回答已采纳

2回答

dplyr 0.5:使用分组安排()

、、

我有很多用dplyr 0.4.3编写的代码，这些代码依赖于分组安排()函数。从0.5版开始，“安排”不再应用分组。这一决定使我感到困惑，因为这使得安排()与其他dplyr动词不一致，而且如果需要取消分组，用户当然可以在安排()之前取消组()。我本来希望在for ()中有一个参数来保留grouped_by行为，但是唉！因此，我必须重写我的分组安排。此时，我唯一的选择似乎是在安排调用时断开管道，循环遍历组和逐组排列，然后再次绑定()结果。我希望有一个更优雅的解决方案？下面是一个MRE，我想运行一个累积吨每group_by(cyl)。非常感谢你的想法/建议。 library(dplyr) m

浏览 4提问于2016-09-09得票数 2

回答已采纳

3回答

dplyr计算两列中的唯一值，而不对long进行整形。

、

使用dplyr计算两列中的唯一值而不进行整形的最佳方法是什么我知道在n_distinct中添加多个参数会导致计算多个参数()的组合。这不是我想要的。我的第一个猜测是在这两列上使用c()，但是输出与我所期望的不一样。有人能解释一下输出的来源吗？一个可能的解决方案是使用union。还有更好的选择吗？ library(dplyr) d <- data.frame(Group = c("A", "B", "B", "C", "C", "C"), node1 = c

浏览 2提问于2020-08-03得票数 1

回答已采纳

2回答

如何在特定的时间窗内预测结果？

、、、、

我有一个有大约10K记录的数据集。我的目标是预测客户是否会流失。二值分类问题，每类代表55:45的比例和20个特征。我明白，当它只是预测，我可以应用一些二进制分类算法，并确定客户是否流失但是，我如何将目标结合起来，以确定客户在30天内是否会出现波动呢？另一个例子是从出院之日起30天内确定病人是否死亡。我有他的出院日期和其他特征，如血压，胆固醇等。我不只是预测他将来是否会死，而是把他的死亡日期限制在30天内。希望我给出的细节能帮助你更好地理解这个问题。

浏览 0提问于2020-02-17得票数 2

回答已采纳

1回答

R中变时间序列的公式应用

、、、、

我在R中有一个数据框架，为此我必须运行一份保留报告。我需要运行df销售月份年的序列/子集的保留公式。 Sale_date, Cancel_date, days_to_cancel, sale_month; 2015-01-01, 2015-04-06, 95, 2015-01; 2015-04-01, , NA, 2015-04; 2015-10-31, 2015-11-02, 3, 2015-10; 2013-05-20, 2014-05-20, 365,

浏览 3提问于2016-01-05得票数 0

回答已采纳

1回答

基于新列文本值的数据分类

、

我正在尝试接受一个现有的数据框架，它有一个状态列，并根据该行的状态添加一个名为Region的新列。因此，例如，任何具有"CA“的行都应该分类为"West”，任何具有"IL“的行都应该是中西部。有四个区域:西部、南部、中西部和东北部。我曾尝试用以下四个代码块单独完成此操作： south <- c("FL", "KY", "GA", "TX", "MS", "SC", "NC", "AL", "LA", "AR

浏览 4提问于2020-11-02得票数 0

回答已采纳

1回答

dplyr在函数内不起作用

、、

我没有在R中使用函数的经验，我正在尝试构建一个通过目标变量计算平均值的函数(在我的示例中是: funded_final)。我的数据： residential_status funded_final Living with parents 0 Rent 0 Rent 0 Own 1 Own 0 Own 0 Rent 0 Rent 0 Rent 0 L

浏览 3提问于2017-03-24得票数 1

1回答

因子的R，最大值

、

嗨，如果这个问题已经问过了，请重定向-我不能直接看到它。我想使用R，并且有一个简单的dataframe:第一列是ID，第二列是分数。每个ID有36行和相应的分数。有几千张身份证。我想要生成一个摘要，其中包含:每个唯一ID的一个条目，以及它们在36行中的最大得分。我对R也很陌生，但我知道以下几点： apply(dataframe，2，max)将给出最大值，但不按ID细分。我知道有一系列的“应用”函数可以应用于一个表上，但我不知道如何组合才能得到我想要的。如果它在Excel中，它将相当于一个简单的数据透视表，但我想学习如何在R中高效地完成它。非常感谢

浏览 0提问于2015-07-13得票数 0

回答已采纳

1回答

如何将另一个数据集中的值与R中第一个数据集中包含的值合并？

、

我有以下两组数据：我想通过以下方式合并以上两组数据。变量income是一个分类变量，取值范围从0到16。对于每个值，排名列只包含一个与income中的值相等的值。我想将排名中找到的收入值与第二个数据集的下限和上限附加在一起。对如何做到这一点有什么见解吗？我是R的新手。

浏览 0提问于2020-09-26得票数 0

1回答

删除数据帧中具有某些NA值的特定行

、

只有在找到NA值的其他行与数据帧中的其他值匹配时，我才希望从数据框架中删除列具有NA的行。例如, df <- data.frame(ID = c(1,1,2,2),DAY=c(1,1,2,3), VAL=c(1,NA,NA,5)) 我想移除第二行，因为VAL中缺少一个值，并且已经有一个ID =1和DAY =1的VAL值。 ID DAY VAL 1 1 1 2 2 NA 2 3 5 知道怎么做吗？我可以尝试写一个循环，但这似乎没有效率。

浏览 2提问于2015-07-28得票数 2

回答已采纳

1回答

长格式表-根据行位置计算

我以长格式设置的dataset abweichung。每一行对应一个计算。列Berechnung包含原始值"EconoMe原始“和50个修改- "Berechnung”。我想计算"EconoMe原始“和"Berechnung”之间的更改(单位：%)，并将输出保存在dataset中的nwe列中。问题是，我有多个“经济原初”值，每个值都有50个修改。它们被合并到一个长格式数据表中。如何对计算进行编码？我试着写一个函数，但它没有起作用。我是R的新手，但我相信这有一个简单的解决办法。

浏览 3提问于2017-04-10得票数 1

回答已采纳

1回答

R dplyr文本挖掘错误(rhs，env，env)：找不到对象‘得分’

、、、

我目前正在从事一个R项目，我正在定义一个函数，该函数将在特定的数据集上执行文本挖掘。其基本思想是有一个函数来计算所挖掘的文本的数量，并将该数字与每个文本的分数相乘。到目前为止，我已经用以下方法定义了这个函数： function_a <- function(data, dict) { data %>% inner_join(dict) %>% count(word) %>% n*score } 我试图通过将表象数与其权重相乘来计算分数，但我得到了一个错误： Error in eval(rhs, env, env) : object 'score'

浏览 1提问于2018-11-06得票数 0

回答已采纳

2回答

我如何按照分类学术语父级排序，然后按发布日期进行排序？

、

我有以下分类结构：位置第1组地点1 地点2 第2组地点3 地点4 第3组地点5 地点6 部分内容被张贴到网站上，并且每个内容都有一个位置和一个与其相关的发布日期。当显示视图时，如何将结果按父项ID (组1-3)分组，然后按组内的post日期分组？我试过使用“分类法术语:名称”排序标准，但是添加“内容:后期”标准似乎没有效果。

浏览 0提问于2013-01-15得票数 2

2回答

R:如何计算A列中用逗号分隔的所有字符值？

、、

下面是几行我正在使用的测试数据。我希望计算ICD10Code列中所有字符的频率，这些字符由列分隔。从下面的代码段中，我使用了group_by，因为每个"PatientId“值在该列中都有重复值，但在其他列中有唯一值。如何计算所有字符值的频率？ PatientId ReferralSource NextAppt Age InsuranceName ICD10Code 1584 St Francis Y 34 SLIDING FEE SCHEDULE M5136, N809, R51, Z6831 2655

浏览 0提问于2019-12-12得票数 0

回答已采纳

1回答

使用one-hot编码器构建决策树

、、

我需要在分类数据上构建决策树。我知道scikit-learn只能处理数值，因此推荐的方法是使用on-hot编码，最好使用Panda Dummies。因此，我构建了一个样例数据集，其中所有属性和标签都是分类的。在这个阶段，我试图理解如何‘一热’编码，以便能够使用sklearn，但文档没有解决这种情况。最终可以给我一个快速的例子或一些初学者的材料的链接？

浏览 10提问于2018-01-18得票数 0

1回答

CreateTableOne输出没有显示分类变量

我试图使用tableone包和CreateTableOne命令创建一个表1，描述R中连续变量和分类/二进制变量的描述性统计信息。我得到了一个只有连续变量出现的表1。下面是我用来首先将数值变量转换成分类变量的代码，然后尝试创建我的表1。也许问题在于我如何将变量从数字转换为范畴？非常感谢您的建议！ #将数值变量转换为分类变量名称<- c(“吸烟”、“酒精”、“与伴侣同居”、"maternal_yrs_schooling“、”母亲“、"hshldincome”、"srq20binary“、"wave") finaldata，name <- lap

浏览 6提问于2021-12-15得票数 0

2回答

如何根据列聚合数据

、、

我是R的新手，我试图弄清楚如何将数据合并成一种独特的格式，然后将这些数据输入postgres数据库。下面是提供格式示例的代码： df <- data.frame("1"=c("us","fr","us","fr","de", "de"), "2"=c(35, 20, 35, 20, 22.25, 125), "3"=c(105, -67.56, 105, -67.56, 138, 12), "4"=c(100, 200, 80,

浏览 4提问于2016-09-18得票数 0

回答已采纳

1回答

基于滞后差的数据帧线分组

我正在努力解决一个R编程问题。我正在处理一个数据框架，例如： START STOP 1 535 545 2 545 555 3 555 565 4 565 575 5 575 585 6 585 595 7 595 605 8 605 615 9 615 625 10 625 635 11 2635 2645 12 2645 2655 我想对随时间连续的线路进行分组(即，行1和3，因为545 - 545 = 0，或者更小，例如>= - 20 )。我

浏览 0提问于2015-03-04得票数 1

3回答

当行可以由多个类别变量定义时，如何根据类别变量设置数据框子集

、

我有一个非常大的数据框，我想删除包含某些分类变量的所有条目。数据帧使得行条目可以具有分配给它的多于一个的分类变量。在这个简化的示例中： x<-(1:10) y<-c("a,b","c,d","c","c","a","a,d","b,d","c","c","a") example_df <- data.frame(x,y) example_df 注意，行条目1被定义为由逗号分隔的"a“和"b”，而行5被定

浏览 7提问于2020-11-22得票数 0

2回答

R中特定行序列的平均计算

我有以下R码： n = 10 t = 5 N = n * t x <- rnorm(N) 我要计算每一个t观测值的平均值。这就是： mean(x[1:5]) mean(x[6:10]) . . mean(x[46:50]) 类似地， mean(x[c(1,11,21,31,41)]) mean(x[c(2,12,22,32,42)]) . . mean(x[c(10,20,30,40,50)]) 我怎样才能简单地做到这一点呢？谢谢你的帮助。

浏览 4提问于2022-04-16得票数 1

回答已采纳

1回答

如何将整个excel列的内容分组？

、、、

早上好，社区，我想询问任何建议，您必须解决下面的问题，我有一个数据集。结果，我希望在左边图片的"Municipio“栏中，每当我更改市政名称时，该列的数值就会增加，以便能够将所有数据分组，并根据您在右边图像中看到的"codigo municipio”对其进行分类。我不手动做，因为有1000多个城市，我要花一天多的时间来完成这项工作，所以我想知道是否有人有提案，非常感谢。

浏览 3提问于2022-09-29得票数 0

回答已采纳

4回答

R中dplyr中的“添加缺失分组变量”消息

、

我的脚本中有一部分以前运行良好，但最近产生了一条奇怪的语句，在此之后，我的许多其他函数无法正常工作。我试图选择第8和第23位的排名列表中的每个网站的价值，以找到第25和75%的数值，在一年中的每一个网站，为30年。我的方法如下(适用于四行数据集-对于我整整30年的数据集，切片(3)通常是切片(23))： library(“dplyr”) mydata structure(list(station_number = structure(c(1L, 1L, 1L, 1L), .Label = "01AD002", class = "factor"), year

浏览 4提问于2016-07-21得票数 57

回答已采纳

1回答

n=n( )在R中是什么意思？

、、

前几天，我在R中读了下面这几行，我不明白%>%、summarise(n=n())和summarise(total=n())是什么意思。不过，我理解group_by和ungroup方法。有人能帮上忙吗？也没有任何关于这方面的文档。 library(dplyr) net.multiplicity <- group_by(net, nodeid, epoch) %>% summarise(n=n()) %>% ungroup() %>% group_by(n) %>% summarise(total=n())

浏览 3提问于2014-09-16得票数 9

4回答

从R中的日期数据创建分类变量

、、

我有包括日期(dd/mm/yyyy)的数据，我想按年汇总这些数据。我确信有一种更简单的方法可以做到这一点，但我采用的方法是尝试使用"cut“函数创建一个新的分类变量。例如： # create sample dataframe dates<-c("01/01/2013", "01/02/2013", "01/01/2014", "01/02/2014", "01/01/2015", "01/02/2015") cases<-c(3,5,2,6,8,4) df<-as.da

浏览 32提问于2017-01-24得票数 1

2回答

在R中具有句点数据类型的If语句

、、

在R中使用time类有时可能会有一点挑战。我的数据集是一列日时间(H/M/S)。然而，当我导入数据集时，R将其分类为chr。我想做的是创建一个额外的列，它的值等于1，以防时间在10.30.00之后，否则为0。通过lubridate，我成功地将数据转换为Period数据类型： db %>% dplyr::select(Time) %>% mutate(Time = lubridate::hms(Time)) 尽管如此，我并不确切知道如何将if语句应用于类Period的结果列Time，如下所示： %>% ifelse(Time > 10H 30M 0S, 1, 0)

浏览 8提问于2020-10-03得票数 2

回答已采纳

1回答

创建一个变量，将观察结果分类为由其他变量的值相等条件定义的观察组。

、、、

我与这个问题斗争了很长一段时间，我在互联网上进行了广泛的研究，但始终没有找到解决办法。假设我有以下数据集： df <- data.frame("Individuals" = c(1,2,3,4,5,6), "Height" = c(150, 200, 200, 200, 150, 150), "Weight" = c(100, 50, 50, 100, 50, 100)) 此数据集有6个个体。对于每个个体，我们测量两个属性:身高(取150厘米或200厘米)和体重(取50公斤和100公斤)

浏览 4提问于2021-07-30得票数 0

回答已采纳

3回答

在R中种树

、、、

我是R的新手，我正在尝试建立一个决策树：以下是我的一些数据集： Malo Edad Sexo nivel_estudios Estado Civil 1 35 Femenino Secundaria Union Libre 0 48 Femenino Bachillerato Casado 0 45 Masculino Bachillerato Casado 1 27 Femenino Bachillerato Union Libre 当我

浏览 0提问于2014-07-17得票数 0

2回答

如何根据r中另一列中的值删除重复值

、

我的数据如下： HH_ID INDUSTRY FREQUENCY 1002 NURSE 2 1002 DOCTOR 1 1003 NOT APPLICABLE 3 1004 ENGINEER 1 1004 CLERK 1 1004 NURSE 1 在一个数据集df1和另一个数据集中，它看起来如下所示 HH_ID INDUSTRY AGE 1002 NURSE 26 1002 NURSE

浏览 2提问于2016-06-23得票数 0

回答已采纳

1回答

从R中的基线计算变化

、

我在R中有一个数据集，其中包含按时间的观测值。对于每个主题，我有最多4行，一个ID变量，一个时间变量和一个称为X的变量，它是数值的(但也可以是分类的)。我希望通过ID计算从基线到每一行的变化。到目前为止，我在SAS中这样做，这是我的SAS代码： data want; retain baseline; set have; if (first.ID) then baseline = .; if (first.ID) then baseline = X; else baseline = baseline; by ID; Change = X-baseline; run; 我的问题是:我如何在R中做到

浏览 0提问于2016-10-08得票数 0

2回答