在data.table中分组后查找统计信息_使用R中的函数查找chi统计信息_在Gadfly中处理统计信息 - 腾讯云开发者社区

、

我有一组包含多个变量的数据。其中一个变量-阶乘包含组的命名- A，B，C等。其余的变量是数字的。 > data1 Group Value 1 A 23 2 A 25 3 B 1 4 C 15 5 C 11 6 C 14 7 B 3 8 B 4 9 B 2 10 C 19 对于进一步的统计计算，我想从数据集中排除包含特定组(例如X)的行，但条件是该组在dataframe n次中找到(例如，少于2次)。我之前看到的材料

浏览 1提问于2016-08-18得票数 3

回答已采纳

1回答

使用data.table的简单频率表

、

我正在寻找一种通过data.table进行简单聚合/计数的方法。以虹膜数据为例，每个物种有50个观察值。要统计每个物种的观察值，我必须在物种以外的列中进行汇总，例如"Sepal.Length“。 library(data.table) dt = as.data.table(iris) dt[,length(Sepal.Length), Species] 我对此感到困惑，因为乍一看，我似乎在Sepal.Length上做了一些事情，而实际上只有物种才是重要的。这是我想说的，但我得不到有效的输出： dt[,length(Species), Species] 正确的输入和输出，但代码笨拙：

浏览 1提问于2012-08-31得票数 34

回答已采纳

3回答

在R中获取具有多年完整数据的观察值的描述性统计

、

我有以下面板数据集 id year Value 1 1 50 2 1 55 2 2 40 3 1 48 3 2 54 3 3 24 4 2 24 4 3 57 4 4 30 我想获得观察者有信息可用的年数的描述性统计数据，例如:只有一年信息的个人数量是1，只有两年信息的个人数量是1，而拥有三年可用信息的个人数量是2。

浏览 12提问于2017-08-31得票数 1

回答已采纳

1回答

需要帮助将列数据组织和汇总到R Markdown中

、

对不起，如果这是一个简单的问题，但我有一个问题我将一个.csv文件导入到RStudio中。下面链接的图片是它看起来是什么样子的示例。我想为每种类型(宝马、奔驰、本田)创建单独的数据帧，然后为每个子集的数据帧创建汇总统计信息。我很迷惑，我甚至想不出这个问题的正确标题。任何帮助都将不胜感激。

浏览 15提问于2019-11-18得票数 0

2回答

用相同值对行进行分组

我正在处理极端干燥的事件，并试图获得一些关于他们的特点的信息。这是我的数据的一个例子： dat <- data.frame(length= c(39,1,1,1,98,1,1,1,57,1,1,1,34,1,1), value = c(0,-1.111,-1.645,-1.285,0,-1.223,-1.369,-1.007,0,-1.083,-1.675,-1.119,0,-1.554,-1.6228)) 行是月份，因此列'length‘用数字1标识干燥月份，而列'value’则记录干事件的严重程度。我想得到的是，一方面，干燥事件的中位数和最大长度，但考虑到每组连

浏览 0提问于2019-01-24得票数 3

回答已采纳

3回答

计算两列中组合出现的次数

、

嗨，我有一个数据框Y，它看起来像下面这样 O T Dist 2 13 0.123 2 3 0.452 2 4 0.213 3 5 0.231 3 8 0.213 4 5 0.123 5 8 0.543 我希望创建一个新的数据框，它统计一个数字在O列和T列组合中出现的总次数。输出应该如下所示。 P freq 2 3 3 3 4 2 5 3 8 2 13 1 预先感谢您的帮助

浏览 0提问于2015-02-02得票数 0

1回答

使用data.table用多个键设置奇怪的行为

、

我已经在data.table中设置了多个键，但是当我尝试通过键的多个值选择行时，它似乎会为每个潜在的组合返回一行，但是对于不存在的行，则会返回NA。我可以在的1c中获得示例代码，所以它肯定是我没有看到的东西。任何帮助都将不胜感激。 library(data.table) dt = data.table(colA = 1:4, colB = c("A","A","B","B"), colC = 11:14) setkey(dt,colA,colB) print(

浏览 4提问于2017-06-15得票数 3

回答已采纳

2回答

如何将r中相同的实例分组为一个，同时生成频率和平均统计量？

、、

我正处于清理/整理数据的最后阶段，希望能对这一步提出建议。我对R并不熟悉，也不完全理解数据格式或其他数据类型是如何工作的。(我正在努力学习，但有一个项目到期，所以需要一个快速的解决方案)。我从CSV文件中导入了数据。我想用相同的(date，ID1，ID2，ID3)对实例进行分组。我需要输出中所有统计数据的平均值，以及一个包含实例数量的新列。注: ID3包含。我想把这些重命名为"na“，然后分组，我尝试了解决方案 tdata$ID3[is.na(tdata$ID3)] <- "NA" tdata[["ID3"]][is.na(tdata[[

浏览 8提问于2017-04-02得票数 1

回答已采纳

13回答

如何获取分组汇总统计数据

、

我正在尝试在R/S+中获得多个汇总统计信息，并按分类列一次分组。我找到了几个函数，但所有这些函数都对每个调用执行一个统计数据，比如aggregate()。 data <- c(62, 60, 63, 59, 63, 67, 71, 64, 65, 66, 68, 66, 71, 67, 68, 68, 56, 62, 60, 61, 63, 64, 63, 59) grp <- factor(rep(LETTERS[1:4], c(4,6,6,8))) df <- data.frame(group=grp, dt=data) mg <- aggre

浏览 8提问于2012-03-24得票数 88

3回答

移除R中数据集中组的顶部和底部十进制

我有一个与下面的数据相似的数据集 Type Count A 0.022496545 A 0.969600752 A 0.476144762 A 0.142649351 A 0.902891034 A 0.004099406 A 0.80460619 A 0.642014007 A 0.688212724 A 0.879709931 B 0.886410732 B 0.803057447 B 0.203613404 B 0.606411333 B 0.886645412 B 0.418132624 B 0.65350920

浏览 4提问于2017-01-23得票数 1

回答已采纳

1回答

如何将我的数据框转换为行和列？

、、、、

我有一个包含两列的数据框，"Type“和"Stats”。我希望每种类型都有一行，所有的统计数据都在单独的列中。例如，我的数据框如下所示： Column Type has values: A A A A B B B B Column Stats has values:15 2 73 12 12 6 52 17 我希望它看起来像这样： Column Type has values: A B Column Stat1 has values: 15 12 Column Stat2 has values: 2 6 Column Stat3 has values: 73 52 Colu

浏览 6提问于2020-02-13得票数 0

1回答

带条件的数字序列(续)。data.table解决方案？

、、

昨天我问了一个问题。感谢那些帮助我解决这个问题的人。我的最小示例是 library(dplyr) ID = c(101, rep(102, 2), rep(103,5)) start = as.Date(c('2/1/2010', rep('5/17/2011', 2), rep('5/17/2011', 5)), '%m/%d/%Y') end = as.Date(c('3/5/2010', rep('1/4/2012', 2 ), rep('8/4/2013&#

浏览 12提问于2020-05-12得票数 2

回答已采纳

1回答

将多列值设置为一行，并按

、

我正在使用data.table包来加速对数据集的汇总统计收集。我很好奇是否有一种方法可以按一个以上的列分组。我的数据如下： Date Value 2016-12-11 36 2016-12-11 40 2016-12-12 17 2016-12-12 41 2016-12-12 27 ... 2017-2-21 22 2017-2-21

浏览 0提问于2017-03-14得票数 1

回答已采纳

1回答

如果另一列包含特定的值集，则使用R中的dplyr筛选列

、、

在以下数据框架中，我希望筛选包含person "a“、"b”和“c”的组： df <- structure(list(group = c(1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4, 4), person = structure(c(1L, 2L, 1L, 3L, 1L, 2L, 3L, 1L, 1L, 2L, 3L, 4L), .Label = c("a", "b", "c", "e"), class = "factor")), .Names = c("gr

浏览 0提问于2017-06-11得票数 2

回答已采纳

1回答

当列为非数值时按R data.table中的组聚合

、

我有一个数据集，看起来像： id | X | Y 1 | 5 | a 1 | 6 | a 1 | 9 | a 2 | 2 | f 2 | 6 | f 列Y是组id中相同的字符串或因子。在data.table中，我试图按组进行聚合，并得出一些统计数据，例如，X的平均值( id )。我也想得到Y。最终的结果是 id | X | Y 1 | 6.66 | a 2 | 4 | f 如果没有因子/字符串变量，我在data.table中这样做的方式是dt[,.(X = mean(X)), by = .(id)]。如果Y是一个组内相同的数值变量，我也可以使用max, min, me

浏览 1提问于2021-06-10得票数 1

回答已采纳

1回答

不同列R中的条件和

、

我想根据A列中的数字在B列中求和数字。例如： A栏: 2001 2002 2002 2002 2003 2003 B栏:1 2 3 4 5 6 我想在A的基础上增加一列C，它是B的总和，我想要的结果是： A栏: 2001 2002 2002 2002 2003 2003 B栏:1 2 3 4 5 6 C栏:1 9 (2+3+4) 9 9 11 11 我做了很多搜索，但真的不知道从哪里开始，谢谢您的帮助！

浏览 1提问于2016-12-09得票数 0

回答已采纳

2回答

在SQL表上创建统计信息之前，检查是否存在相同列的统计信息。

、

我需要在具有不同列组合的表上创建一些统计信息。但是，对于相同的列组合，可能已经存在一些统计数据。因此，在创建包含列组合的统计数据之前，我希望检查是否存在具有相同列组合的统计数据。如果存在，我就不会创建统计数据，如果不存在，那么只有我会创建统计数据。例如，在此表上创建一个表和一个统计数据如下： CREATE TABLE Gift ( Gift_Id INTEGER IDENTITY (1,1) PRIMARY KEY, Person_Id INTEGER, Event_Id INTEGER, Agent_Id INTEGER, Fund_Id

浏览 0提问于2018-07-28得票数 3

回答已采纳

1回答

如何连续地将data.table按几列分组

、

我想用几百个分组vars分组的描述性统计数据。我从中了解到，如果我想使用stat来组合vars，我可以在分组参数中使用list( )。在我的例子中，我想要Y的每个级别的平均值，而不是Z的每个级别的平均值。 # example data set.seed(007) DF <- data.frame(X=1:50000, Y=sample(c(0,1), 50000, TRUE), Z=sample(0:5, 50000, TRUE)) library(data.table) DT <- data.table(DF) # I tri

浏览 1提问于2018-01-31得票数 5

回答已采纳

2回答

用累加码创建一个新表似乎不起作用？

、

因此，我使用dplyr创建一个新的数据框架来绘制:第1列中的date、第2列中的IDCount和第3列中的CumulativeIDCount。 df2 <- df %>% group_by(Date)%>% summarise(IDCount =n(),CumulativeIDCount=cumsum(n())) 但是cumulativeIDCount列不是累积的，它与IDCount列完全相同。我的代码哪里出错了？

浏览 1提问于2019-05-26得票数 0

回答已采纳

2回答

用惯用的dplyr和/或data.table方法一步一步地得到组的意思和宏大的意思。

、、

我同时使用dplyr和data.table，所以我感兴趣的是是否有使用任何一个包的解决方案。我通常希望用摘要统计来总结数据--比如说，为了示例--通过一些分组变量和整个数据集(大平均值)来总结数据。然后，我通常将它们组合成一个输出数据，以供显示，分组变量列中的大平均值行指定为“总计”或“总体”。以下是我通常是如何使用dplyr和data.table实现的德普利 library(dplyr) d <- tibble(grp = rep(letters[1:3], 10), v = 1:30) group_means <- d %>% group_by(grp) %

浏览 3提问于2022-04-01得票数 1

回答已采纳

1回答

根据符合标准的观测数在R中细分数据集。[R]

我有一个如下所示的数据集： Employee Month CSAT ABROWN February 4 ABROWN January 5 ABROWN March 3 ABROWN March 5 JSMITH February 5 JSMITH January 3 JSMITH February 5 JSMITH March 5 JSMITH February 5 JSMITH J

浏览 2提问于2016-09-19得票数 1

回答已采纳

1回答

SQL Server中耗时最多的查询计数

、

如何统计SQL Server中特定数据库耗时最多的查询例如:时间在30到45分钟之间的查询计数、时间在45到60分钟之间的查询计数、时间大于60分钟的查询计数。

浏览 1提问于2020-06-17得票数 0

2回答

向量化矩阵中的加权算术

、

我想知道是否有任何方法可以跨矩阵向量化加权算术。例如，用于计算给定weights以下的values的加权平均值 set.seed(12321) values = matrix(sample(10:40, 6, replace = TRUE), ncol = 2) weights = matrix(sample(1:5, 6, replace = TRUE), ncol = 2) 我们可以这样做： w.mean = numeric() for (i in 1:dim(values)[1]){ w.mean[i] = stats::weighted.mean(x=values[i,], w

浏览 41提问于2019-02-04得票数 2

3回答

基于重复行的两列计算唯一值，R数据帧

、、、

我有一个R数据框架，格式如下： column1 column2 NA NA 1 A 1 A 1 A NA NA NA NA 2 B 2 B NA NA NA NA 3 A 3 A 3 A df = structure(list(column1 = c(NA, 1L, 1L, 1L, NA, NA, 2L, 2L, NA, NA, 3L, 3L, 3L), colu

浏览 3提问于2017-04-11得票数 2

回答已采纳

3回答

在data.table (r语言)中聚合具有2列的数据

我有我的表(输入)： date directorName companyName rank 2015-08-01 Sergey vino 29 2015-08-02 Sergey vino 42 2015-08-09 Sergey vino 25 2015-08-04 Sergey vino 27 2015-08-05 Mike bolder 29

浏览 1提问于2016-08-08得票数 1

回答已采纳

1回答

R中数据中按类别计算的单词数

我有一个带有文本评论的专栏，另一个有评级的专栏： Content Rating "bluetooth is bad" 1 "head unit crashes" 2 "remote works awesome" 5 我想输入一组关键字，并统计它们在评论中的出现，按不同的评级。简单地说，找出不同的人(评级定义了队列)提到的最多的东西。 Rating Word Count 1 bluetooth 1 1 head unit 0

浏览 2提问于2017-04-06得票数 1

回答已采纳

1回答

分别针对每个组的Solr统计信息

、、

我正在尝试获取solr中每个分组数据的指定统计数据。我设法将数据分组，但统计数据是针对整个数据的，而不是针对每个组的。 group=true&group.field=potential_campaign_type&group.ngroups=true&group.limit=0&stats=true&stats.field=potential_total_amount 我的solr参数如上图所示。这将返回数据的全部统计信息。但是，我需要每个分组对象的统计数据。我该怎么做呢？

浏览 17提问于2021-04-08得票数 0

回答已采纳

1回答

如何为另一列R的每个级别获取列的最大值的索引

给出这样的数据： COUNTRY CITIZENS SURFACE A 20000000 40 A 80000000 78 B 3000000 120 B 200000 27 C 10000000 56 A 5600000 20 C 10000000 30 B 2500000 20 我想用对应于每个国家级别公民的最大值的行来划分数据。我用dplyr得到了每个国家的“公民”的最大值，并对其进行了总结，但我无法为每个最大值提取相应的表面值

浏览 0提问于2020-03-27得票数 1

回答已采纳

1回答

如何计算data.table组中的不同组合？

、

我希望在某个组中的组合中计算data.table中的列的不同值的数量。简单的例子:数据看起来像 room | object ----------------------- kitchen | dishwasher kitchen | oven livingRoom | sofa 现在我想知道:每个房间里有多少个不同的物体？答案很简单： library(data.table) dt = data.table(room = c("kitchen", "kitchen", "livingRoom"), object = c(&

浏览 4提问于2017-12-29得票数 2

回答已采纳

2回答

R:为特定值添加计数列

、、

我正在寻找一种简单的方法来子集我的df和附加一个列的频率计数。假设我有这样一个df： Name JA JN JA JB JA JN 我想得到这样的结果： Name Frequency JA 3 JN 2 JB 1 有什么建议吗？谢谢。

浏览 4提问于2016-08-08得票数 0

回答已采纳

1回答

如何找到一个人打开电子邮件的最佳时间

、

我有一个数据集，其中包含如下详细信息： campaignID, emailAddress, sendDatetime, openDatetime A a@x.com 20151001-1000 20151001-1005 A b@y.com 20151001-1000 20151001-1230 B a@x.com 20151007-1000 20151007-1100 B b@y.com 20151007-1000 20151007-1235 使用R，我如何才能找到

浏览 2提问于2015-10-26得票数 0

回答已采纳

1回答

根据变量/NA的存在总结数据帧:在R中

、

对于示例数据帧： df <- structure( list( country = structure( c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L, 3L), .Label = c("Austria", "France", "UK"), class = "factor" ), id = 1:10, region.0 = structure( c(1L, 1L, 1L, 2L, 2L, 2L,

浏览 0提问于2016-03-03得票数 2

2回答

如何根据特定的开始和结束条件统计每个ID的总剧集数？

我有一个数据帧，看起来像这样： data<-data.frame("ID" = c(rep("A", times = 13), rep("B", times = 7)), "Value" = c(112,130,67,120,117,45,56,90,140,210,30,45,65,220,145,34,45,89,120,180)) 我想添加一个统计每一集的专栏。一个插曲是从值<70的第一次出现到值>=70的第一次出现。有时，在初始

浏览 14提问于2019-08-21得票数 1

回答已采纳

1回答

为唯一的观测值组合创建数据值

我正在使用R，并对查找在一次访问中查看的所有独特的产品组合感兴趣。产品由product_key标识，由visit_key访问。在下面的数据中，visit_key =1查看了一个产品= pk_18280。Visit_key = 28是第2-4行，并查看三个产品(pk_57716、pk_1820、pk_14501)。查看产品的顺序对我的分析并不重要(而且，任何排序都应该导致相同的分组)。我想要的是一个列，可以用来查找只查看pk_18280 (如visit_key = 1)或查看所有三个产品(如visit_key = 28 )的所有访问。提前感谢！ visitor_key visit_n

浏览 1提问于2014-02-26得票数 0

2回答

在Rapidminer中进行计数

如何对word文档中的列表进行行数统计？？如果相同的列表在excel中，我可以使用聚合运算符进行计数，但在word文档中不会发生这种情况。

浏览 3提问于2016-01-06得票数 0

1回答

当列中的值在df中相等时添加行

对于一个样本数据： df <- structure(list(animal.1 = structure(c(1L, 1L, 2L, 2L, 2L, 4L, 4L, 3L, 1L, 1L), .Label = c("cat", "dog", "horse", "rabbit"), class = "factor"), animal.2 = structure(c(1L, 2L, 2L, 2L,

浏览 1提问于2015-02-04得票数 0

回答已采纳

1回答

使用Bro收集当前流量的统计信息

、、

我想每10秒收集一次流量统计数据，我找到的唯一工具是connection_state_remove event， event connection_state_remove(c: connection) { SumStats::observe( "traffic", [$str="all"] [$num=c$orig$num_bytes_ip] ); } 如何处理那些在此期间结束时仍未删除的连接。如何从他们那里获得统计数据？

浏览 30提问于2017-10-19得票数 0

1回答

R:随机抽样来自一系列类别的偶数观测

、、、、

我之前从我的数据中随机抽取了一个邮政编码样本，然后意识到我并没有在所有更高层次的统计单元中进行抽样。我有大约100万的邮政编码和7000中等输出统计单位。我希望样本有大致相同数量的邮政编码来自每个统计单位。如何从每个高级统计单位随机抽取35个邮政编码？我使用了下面的代码随机抽样250,000个邮政编码： total.sample <- total[sample(1:nrow(total), 250000, replace=FALSE),] 如何根据另一个列变量(例如高级统计单元(见下面数据结构中的msoa.rank ))指定一个

浏览 9提问于2014-06-30得票数 3

回答已采纳

1回答

是否有与Stata的egen函数等价的？

、

Stata有一个非常好的命令egen，它可以轻松地计算一组观察的统计数据。例如，可以计算每个组的最大值、平均值和最小值，并将它们作为变量添加到详细的数据集中。Stata命令是一行代码： by group : egen max = max(x) 我从未在R.summarise包中找到相同的命令，这使得计算每个组的统计信息变得很容易，但是接下来我必须运行一个循环来将统计数据与每个观察相关联： library("dplyr") N <- 1000 tf <- data.frame(group = sample(1:100, size = N, replace = TR

浏览 2提问于2014-06-11得票数 8

回答已采纳

1回答

随着时间的推移，与模式(按组划分)相等的分组观测数

、、、、

我正在研究X值在分组数据中随时间的变化情况。对于大多数观测，X从零开始，然后随着时间的推移随机变化。在每个时间点，我想知道每个组中有多少模式的值--理想情况下不包括零值。数据如下所示，但有更多更大的组和更多的t列。 group_name t1 t10 t50 t100 1 s3 0 259 187 122 2 s1 29 25 23 15 3 s3 0 259 23 122 4 s2 0 36 24 15 5 s1 29 25 23 15

浏览 2提问于2020-08-30得票数 1

回答已采纳

2回答

关于在r中加速双for循环的建议？

、、

我有下面的代码，它产生了我想要的东西，但我几乎可以肯定它可以写得更好(而且执行起来也需要很长时间)。有什么建议可以帮我清理吗？基本思想是，我想要一个表，其中包含变量var3中的“最高”字母(A、B或C)，用于var1 og var2的每个唯一组合。 var1 <- c(rep.int(1:3,3)) var2 <- c(sample(letters[1:3], NROW(var1), replace = TRUE)) var3 <- c(sample(LETTERS[1:3],

浏览 7提问于2015-12-22得票数 1

回答已采纳

1回答

R一步聚合数据帧和计数

、、、

我想知道是否有一种方法可以一步一步地完成以下工作。我有两列，一列的字符不是唯一的，另一列是数字。我做了： sum<-(aggregate(x=df$numbers, by=list(df$char), FUN=sum) sum$char <- sum$Group.1 sum$Group.1 <- NULL df <- setDT(df)[, .N, char] df <- merge(df,sum,by="char") 想知道是否会有其他方法，例如使用cast，这将是一样简单，但一步。

浏览 0提问于2016-05-27得票数 0

回答已采纳

1回答

R:将数据帧中组的值保持在99分位数以下

、、

我有一个包含组和值的数据格式。首先，我计算了每组99%的分位数。现在，我要删除每个组99%分位数以上的值。 df<-data.frame(group = rep(c("A", "B"), each = 4), value = c(c(6,5,80,4,60)*10,3,5,4)) # data group value 1 A 60 2 A 50 3 A 800 4 A 40 5 B 600 6 B 3 7 B 5 8

浏览 2提问于2017-11-16得票数 3

回答已采纳

1回答

df中列的特定值的NA's和

我需要在一个数据帧列表中得到每个月NA的总和。该列表由若干长度不同的数据帧组成，如下所示： date year month day hour rain temp rhum 1 1950-01-01 01:00:00 1950 1 1 1 0 5.1 93 2 1950-01-01 02:00:00 1950 1 1 2 0 6.1 91 3 1950-01-01 03:00:00 1950 1 1 3 0 6.0 92 4 1950-01-01 04:00:00 195

浏览 0提问于2017-01-22得票数 1

回答已采纳

5回答

选择第一个值等于R中的"x“的组

、、、、

我想对R中的分组数据集做一个条件切片。 df <- data.frame(grp = c(1, 1, 2, 2, 3, 3), vehicle = c("car", "boat", "bike", "car", "plane", "bike")) #> grp vehicle #> 1 1 car #> 2 1 boat #> 3 2 bike #> 4 2 c

浏览 8提问于2022-09-20得票数 3

回答已采纳

1回答

时间序列数据通常使用什么描述性统计？

、

我有一个时间序列的每周使用数据，我将尝试使用一些统计数据来划分人口。偏斜和峰度可以让我描述时间序列，并以不同的方式对人们进行分组。但我也注意到一些看过牙的图案，或双峰图案，然后我不认为这两个统计数字会很好地描述它们。与平均值的距离会告诉我，谁的使用是持续稳定的，而不是不可预测的使用。时间序列数据通常使用什么描述性统计？谢谢,

浏览 2提问于2014-07-11得票数 0

回答已采纳

2回答

基于不同列名称变化的重新启动滞后

、

我试图在R上的数据框架中将一个变量的滞后插入到一个单独的列中，但是，我希望每次不同列中的名称发生变化时，延迟都会“重新启动”。数据的一个例子如下： Player Crosses Robbie Brady 11 Robbie Brady 9 Robbie Brady 13 Robbie Brady 15 Robbie Brady 20 Robert Snodgrass 5 我喜欢“十字架”的滞后，我用的是： lag(data$Crosses, 1) 帮我做这个。但是当玩家的

浏览 6提问于2015-08-02得票数 0

回答已采纳

1回答

多列多类别的描述性统计

、、

考虑一下虚拟数据： head(df) group v1 v2 v3 1 3 9 7 1 4 7 6 2 10 9 1 2 12 2 2 2 15 9 10 我需要计算每个组的每个列(v1、v2、v3)的平均值。我尝试了在colMeans()中使用using ()，它的工作方式如下： mean.df = by(df[,2:4],df$group,colMeans) 它工作得很好，但我需要依赖于我想应用于数据的任何函数的“列版本”的存在。例如，当我需要计算标准差或分位数范围(IQR)时，没有c

浏览 3提问于2014-02-25得票数 0

回答已采纳

2回答

R:将无序的长数据转换为宽数据

、

我希望将无序的长数据转换为宽数据。 mydata <- data.frame(cat = c('a','a','a','b','c','c','c','c'), color = c( 1, 1, 1, 2, 1, 1, 1, 1), hat = c( 1, 1, 2, 2, 1, 2, 1, 2),

浏览 3提问于2015-08-12得票数 2

回答已采纳

1回答

R:如何将数据帧拆分成组并应用统计数据

、、

我需要计算一些描述性统计数据，比如各种数据帧的中位数、方差和标准差。所有的数据帧，大约300个，都有相同数量的变量，但观察值的数量不同，就像值一样。因为我还不能生成这个循环，所以我首先尝试在单个数据帧中运行，这是一个可以生成统计数据的循环，它总是将数据帧分成七个观察值的组。我用来生成基本统计数据的循环的第一个数据帧是这样的： # A tibble: 363 x 4 Day Location Flow Qty <dttm> <chr> <dbl> <dbl> 1 2014-03-03

浏览 0提问于2017-09-29得票数 0