腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
带有
"
n
()“
函数
的
summarize_all
、
、
我用
summarize_all
()
函数
在dplyr中总结了一个数据帧。如果我执行以下操作:
summarize_all
(mydf, list(mean="mean", median="median", sd="sd")) 我得到了一个tibble,每个原始度量都有3个变量但是当我尝试捕获向量内
的
n
来计算标准差并确保丢失
的
单元不被计算时……
summarize_all
(mydf, list(mean="
浏览 21
提问于2019-09-24
得票数 3
回答已采纳
1
回答
对需要和不需要na.rm=T参数
的
函数
使用
summarize_all
、
、
、
我
的
数据中
的
观察值包含在组中,我试图使用
summarize_all
函数
获取每个组
的
多个汇总统计数据(例如,平均值、中位数、长度、标准差)。问题是一些
函数
(例如,mean、median)需要na.rm=T参数,而其他
函数
(例如,
n
())则不需要。当我在
summarize_all
中指定na.rm=T时,它会将na.rm参数应用于列出
的
每个
函数
(如下所示,mean和sd)。(list(mean, sd),
浏览 0
提问于2019-08-07
得票数 1
2
回答
使用
summarize_all
()查找sparklyr数据
的
中位数
、
、
、
这将为我
的
数据获取count、mean、min、max (vars是列名
的
向量) test<-data%>% dplyr::
summarize_all
(list(count=~
n
(),mean=mean, min=min,max=max)) 但当我尝试将median添加到mix中时,我得到了错误-它不再识别percentile命令,该命令是一个配置单元
函数
,而不是r/dplyr
函数
。(list(count=~<e
浏览 8
提问于2020-09-02
得票数 0
回答已采纳
1
回答
dplyr将列列表传递给要计数缺失
的
函数
。
、
数据:希望创建一个
函数
来计算列列表中丢失和不丢失
的
数量inputvar_quos) %>% return(miss_dt) create_summary(gendata, xcont1,
浏览 3
提问于2019-11-22
得票数 1
回答已采纳
2
回答
R问题: shapiro.test
函数
在dplyr中不起作用::汇总,而其他摘要
函数
则这样做
、
、
、
当我尝试将shapiro.test用作R DataFrame上
的
摘要
函数
时,会得到以下错误:Error: Column `A` mustbe length 1 (a summary value), not 4df = data.frame(A=sample(1:10,5), B=sample(1:10,5))df %>%
summa
浏览 0
提问于2019-04-25
得票数 0
1
回答
在dplyr中同时使用
summarize_all
和summarize
、
有没有办法在dplyr链中将
summarize_all
和汇总语句组合在一起?如下所示: group_by(cyl) %>% summarize(
n
=
n
()) 但这当然不起作用,因为它试图总结一个摘要。预期结果是按cyl分组
的
单个data.frame,每列按平均值汇总,观察次数按cyl计数。我可以通过使用
浏览 2
提问于2018-04-13
得票数 3
1
回答
在列表中总结数据帧
的
方法
、
、
我在一个列表中有一些数据框,它们都具有相同
的
结构-在这个例子中是变量a,b和c。现在我想总结一下整个列表中值
的
平均值。(24,1,.1)c <- rnorm(24,3,.3)}) 我试图给dplyr提供lst %>%
summarize_all
下面的公式给出了列表中每个数据帧
的
平均值,但还没有给出所有数据帧上这些变量a、b和c
的
平均值。lapply(1:10, function(
n<
浏览 12
提问于2017-06-23
得票数 0
回答已采纳
1
回答
data.table、dplyr等对象掩蔽
、
、
、
我是否应该害怕使用dplyr或data.table (独立
的
),因为它们掩盖了许多来自“默认”包(如zoo、xts等)
的
函数
?什么是好
的
练习?由于dplyr和data.table都在CRAN上--我想,作者进行了一些很好
的
实践,或者可能没有遵循
的
指导方针?我看到了许多关于对象掩蔽
的
问题,我想知道dplyr对象命名是否太麻烦了,还是说它是最好
的
选择?
浏览 0
提问于2017-02-12
得票数 0
2
回答
在R中总结一个具有多个功能
的
数据?
、
我对R很陌生,我试图总结一个包含多个
函数
的
数据格式,我希望结果出现在同一列中,而不是每个
函数
的
分隔列中。例如,我
的
数据集如下所示 A B 1 2 3 2我称
summarize_all
(data, c(min, max))为数据格式a_fn1 b_fn1 a_fn2 b_fn2如何使
summarize_all
的
结果变成如下:
浏览 0
提问于2021-07-21
得票数 0
回答已采纳
3
回答
如何使用
summarize_all
为每个组获取与最大索引相关
的
非缺失值
、
、
对于许多列,我希望找到与最大索引值相关联
的
每个组
的
非缺失值。 通过使用
summarize_all
和which.max,我已经非常接近了,但是在找到最新
的
值之前,我不确定如何从每个向量中删除NAs。我读到过在
summarize_all
中使用na.rm和mean这样
的
函数
,但不确定如何在没有内置
函数
的
情况下合并类似的功能。我已经尝试过na.omit,但它没有提供我正在寻找
的
解决方案。grp <- c("a
浏览 33
提问于2019-01-05
得票数 2
回答已采纳
2
回答
R:是否有可能将布尔数据组合在部分重复行
的
多个选择列中?
、
、
、
、
首先,我为我
的
问题如此可怕
的
措辞而道歉。我正在使用R中
的
dataframe,它包含一些
带有
重复ID标记
的
行。有四列与每一行关联,其中包含布尔值,每行只有一列注册为true,这样,如果重复ID标记,则布尔值为true
的
列将有所不同。下面是我正在处理
的
数据
的
一个非常简短
的
示例部分:CCH00090 TRUE FALSE F
浏览 1
提问于2018-06-04
得票数 2
回答已采纳
1
回答
dplyr。光谱(反射率)数据帧。基于单个属性对所有光谱值进行平均。R
、
、
、
我有一个数据帧,它由5个属性(如图、权重、日期等)加上2000个光谱值(不同
的
波长)组成。因此,大约有2005列。最终目标是拥有一个具有2005列、24行
的
数据帧(每行由原始元数据+基于曲线图编号
的
每个波长
的
平均值*组成)。 谢谢
浏览 5
提问于2018-09-03
得票数 1
1
回答
循环遍历每个变量并收集输出R
、
我有一个像这样
的
数据框架。这是一个简单
的
例子,但我所做
的
将更加复杂。我是这样说
的
,这样就不会有人推荐某种形式
的
摘要()类型
的
解决方案。我不知道如何让我指向数据帧ABC
的
单个列。ID__, max__, mean__)} 如果我在SAS中这样做,我会在proc中使用select into来创建变量名
的
列表我如何告诉R对数据帧中
的
每个变量执行这个过程?
浏览 1
提问于2017-05-12
得票数 0
回答已采纳
1
回答
使用tidyverse对tibble中
的
变量求和
、
如何通过将TRUE条件视为'1‘并对db中每个变量
的
计数求和来转换以下输入。如果为FALSE,则为零。
浏览 3
提问于2017-12-14
得票数 0
回答已采纳
1
回答
如何使用数据库让dplyr::
summarize_all
在sparkdataframe上工作?
、
、
、
: dplyr::
summarize_all
(x,mean) 更多信息 这是我目前收到
的
错误消息: Error in UseMethod("tbl_vars") : no applicable methodclass(x) 返回:1 "SparkDataFrame“attr(,"package") 1 "SparkR” Mastering Spark with R这本书中有一个加载小型r数据帧并在其上运行
summarize_all
的
示例: cars <
浏览 17
提问于2020-09-24
得票数 2
回答已采纳
1
回答
星火中
的
SparklyR /枢轴传播
、
、
、
、
我正在尝试将我
的
R代码(如下面所示)重构为Sparklyr R代码,以便在星火数据集上工作,以获得最终结果,如表1所示: var
n
nmissdata_tbl <- as_tibble(data) profile <- data_t
浏览 0
提问于2019-01-17
得票数 1
回答已采纳
1
回答
带有
约x()
的
dplyr
的
summarize_all
()
、
我正在尝试让dplyr
的
summarize_all
()与approx()一起工作。Summarise_impl中
的
错误(.data,dots):评估错误:'x‘和'y’长度不同。 # # A tibble: 1 x 3# <int>
浏览 4
提问于2017-07-31
得票数 0
回答已采纳
1
回答
摘要不接受计数()
、
我使用dplyr为多个列创建了一个摘要数据框,除了count或
n
()之外,它对所需
的
函数
很有效。我想展示观察
的
总数。summ <- Test_data %>% .cols = is.numeric, .names = "{col}_{fn}" )) 它会给出错误: error: Problem with summarise() i
浏览 16
提问于2021-01-28
得票数 1
回答已采纳
3
回答
dplyr: colSums on子分组(group_by)数据帧:优雅
、
我有一个非常大
的
数据集(265,874 x 30),有三个有意义
的
组:年龄类别(1-6岁)、日期(5479个这样)和地理位置(4个总数)。每条记录都包含一个选择,加上27个计数变量。我一直在尝试使用dplyr (v0.2)来完成这个任务,因为手动执行它最终会设置许多冗余
的
东西(或者使用循环来迭代分组选项,因为缺少一个优雅
的
解决方案)。我猜问题归结为:如何最好地使用do()
函数
和。运算符通过colSums总结数据帧。 注: do(.)运算符只应用于dplyr 0.2,因此您需要从GitHub ()而不是CR
浏览 4
提问于2014-05-20
得票数 10
回答已采纳
1
回答
在R中合并数据集中
的
行时求和
、
、
我通过下面的代码合并了我想要
的
行: Similarities <- Home %>%
summarize_all
(.funs(.vars = FTR, .funs = function(x) paste(sum(x))), 300 wate
浏览 22
提问于2020-06-30
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券