首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

dplyr的Summarize函数不能按行为多个列输出正确的结果

dplyr是一个R语言中用于数据处理和操作的包,它提供了一系列函数来对数据进行筛选、排序、分组、汇总等操作。其中,Summarize函数用于对数据进行汇总计算。

然而,dplyr的Summarize函数在处理多个列时可能无法正确输出结果的原因可能有以下几种情况:

  1. 数据类型不匹配:如果要对多个列进行汇总计算,这些列的数据类型应该是相同的,否则可能会导致计算错误。例如,如果一个列是字符型,另一个列是数值型,Summarize函数可能无法正确处理。
  2. 缺失值处理:如果多个列中存在缺失值,Summarize函数默认会将缺失值排除在计算之外。这可能导致计算结果与预期不符。在使用Summarize函数之前,需要先处理好缺失值,可以使用dplyr中的na.omit()函数或者其他方法进行处理。
  3. 列名错误:在使用Summarize函数时,需要确保列名的正确性。如果列名错误或者不存在,Summarize函数将无法找到对应的列进行计算。

为了解决这个问题,可以尝试以下方法:

  1. 检查数据类型:确保要进行汇总计算的列具有相同的数据类型,可以使用dplyr中的mutate()函数将列的数据类型转换为一致的类型。
  2. 处理缺失值:使用na.omit()函数或其他方法处理缺失值,确保数据中不存在缺失值。
  3. 检查列名:确保要进行汇总计算的列名正确无误,可以使用dplyr中的select()函数查看列名。

总结起来,要正确使用dplyr的Summarize函数进行多列汇总计算,需要确保数据类型一致、处理好缺失值,并检查列名的正确性。如果问题仍然存在,可能需要进一步检查数据的结构和内容,以确定其他可能的原因。

关于dplyr的更多信息和使用方法,可以参考腾讯云的R语言开发环境产品,该产品提供了R语言的运行环境和相关工具,方便进行数据处理和分析。具体产品介绍和链接地址如下:

产品名称:腾讯云R语言开发环境 产品介绍链接:https://cloud.tencent.com/product/rstudio

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

R︱高效数据操作——data.table包(实战心得、dplyr对比、key灵活用法、数据合并)

这意味着,输出数据也是按照某种规律,而且通过设置了Key,配套代码编译也受到了简化。...haskey()输出结果为:true/false —————————————————————————————————————————————— 二、数据筛选 1、筛选 .() from_dplyr..., -State) dplyr中是arrange函数,而data.table是setorder函数,同时降序方式。...%>%功能是用于实现将一个函数输出传递给下一个函数第一个参数。注意这里,传递给下一个函数第一个参数,然后就不用写第一个参数了。在dplyr分组求和过程中,还是挺有用。...nomatch参数用于控制,当在i中没有到匹配数据返回结果,默认为NA,也能设定为0。

7.5K43

使用dplyr进行数据转换

library(nycflights13) library(tidyverse) dplyr最常用5个函数: • 按值筛选观测(filter())。...• 使用现有变量函数创建新变量(mutate())。 • 将多个值总结为一个摘要统计量(summarize())。 函数使用方法: (1) 第一个参数是一个数据框。...(2) 随后参数使用变量名称(不带引号)描述了在数据框上进行操作。 (3) 输出结果是一个新数据框。...如果列名不只一个,那么就使用后面的在前面排序基础上继续排序 arrange(flights, year, month, day) 使用 desc() 可以按进行降序排序: arrange(flights...之间所有(包括“year”和“day”) select(flights, year:day) # 选择不在“year”和“day”之间所有(不包括“year”和“day”) select(flights

93510

R&Python Data Science 系列:数据处理(3)

2 汇总函数 Python中汇总函数主要有summarize()和summarize_each()函数,这里"汇总"翻译成概括更加合适,summarize()和summarize_each(...)区别在于:对某(几)列作用几个函数summarize()需要几个函数依次作用于对应,而summarize_each()将几个函数以列表形式作为第一个参数,作用于后面的: Python实现 ##...,函数作用于前两行记录,结果记录在第二行,函数作用于前三行记录,结果记录在第三行......注意:Python中n()函数需要传入参数,R中不需要传入参数;Python中输出列按照字段名称升序排列,R中输出按照书写顺序输出。...5 总结 数据处理1-3,主要介绍了Python中dfply和R中dplyr包中数据处理函数,几乎满足数据预处理中筛选变量、衍生变量以及计算一些统计量需求。

1.3K20

【R语言】基础知识|dplyr管道函数处理表格

01 select()变形函数 dplyr安装就不展示了,dplyr包是内含多函数且功能强大数据处理包。...03 mutate( ) mutate( )函数用来创建新数据框,创建新1为销售额。 ?...04 arrange( ) arrange( ) 函数可用于创建一个新数据框,这个数据框可以按照1个或多个变量进行排序。 desc( ) 函数表示降序排列。让上述表格按照金额和单价进行降序排列。...05 group_by( )+summarize() group_by( ) 这个函数是用来创建分组summarize()用来汇总数据,汇总产品类别和销售城市,同时增加平均数量和均价。 ?...它作用是把符号左侧返回结果,作为符号右侧调用函数第1个参数。实际上,x %>% f(...)相当于于f(x, ...)。 ?

1.7K31

R 数据整理(七:使用tidyr和dplyr处理数据框 2.0)

2.6 arrange 按照数据框里或某几列,对所有行进行排序。可以使用 desc 产生倒序,或写入多个使其按照多个进行排序。...对于即将合并,需要使用引号;但对于想要合并多个列名,可以不用使用引号。sep 参数设定多合并后不同数据分隔使用分割符。...R 数据整理(六:根据分类新增列种种方法 1.0) 其他函数 slice dplyr函数 slice(.data, ...) 可以用来选择指定序号行子集,正序号表示保留,负序号表示排除。...summarize(test, mean(Sepal.Length), sd(Sepal.Length)) 在有多个变量需要汇总时,summarise 格式就会比较罗嗦。...dplyr summarse_at() 函数可以指定一批变量名与一批统计函数,自动命名结果变量,如: d.cancer %>% summarise_at( c("v0", "v1"), list(

10.7K30

生信代码:数据处理( tidyverse包)

在Rstudio中加载tidyverse包,可以看到该包下有8个子包,著名ggplot2包即是其中一个子集,我们先着重讲一下数据处理有关包——dplyr包。...dplyr包下主要是以下几个操作: select()——选择 filter/slice()——筛选行 arrange()——对行进行排序 mutate()——修改/创建 summarize(...1 mutate() mutate()与基础函数transform()相似,都可以添加新,但是允许引用刚刚创建: mydata 85) df %>% filter( between(score, 80, 90)) 4 summarize() summarize()主要用于统计,往往与其他函数配合使用,比如计算所有同学考试成绩均值...,我们如果对个人或者科目感兴趣的话,可以使用group_by(name或者type),然后利用summarize函数就可以求出分类之后各个统计值。

2K10

《高效R语言编程》6--高效数据木匠

broom包提供了模型结果标准输出格式bit.ly[1] P.s,不知道为啥,这网站还得过墙,难道这是架设在了谷哥服务器上。...使用dplyr高效处理数据 这个包名意思是数据框钳,相比基础R优点是运行更快、与整洁数据和数据库配合好。函数部分灵感来自SQL。 ?...summarize是一个多面手,用于返回自定义范围汇总统计值。...非标准计算 代码中没有引号包裹原始名字,这种方式叫做非标准计算(NSE),高效交互使用函数,减少键盘输入,允许Rstudio中自动完成。还是函数多个_。...数据库与dplyr 必须使用src_*()函数创建一个数据源。# 使用data.table()处理数据 是dplyr替代,两个哪个好存在争议,最好学一个一直坚持下去。

1.9K20

dplyr-cli:在Linux Terminal上直接执行dplyr

dplyr功能主要包括: 变量筛选函数 select 筛选函数 filter 排序函数 arrange 变形(计算)函数 mutate 汇总函数 summarize 分组函数 group_by 多步操作连接符...%>% 随机抽样函数 sample_n,sample_frac dplyr-cli介绍 了解完 dplyr包之后,就要介绍咱们这个推文主角了 dplyr-cli。.../dplyr select --file mtcars.csv -c cyl | head -n 6 实例二:多个数据处理参数结合 创建名为 cyl2新一,它值为 cyl两倍,再提取 cyl...值为8行,最后使用 kable参数,在terminal输出类似表格结果 cat mtcars.csv | \ ....| 19.74286|| 8| 15.10000| 简单几个命令就将,根据cyl值来计算mpg平均值任务执行好,并且输出到屏幕中。

2K10

「R」数据操作(七):dplyr 操作变量与汇总

使用mutate()添加新变量 除了选择已存在,另一个常见操作是添加新。这就是mutate()函数工作了。 mutate()函数通常将新增变量放在数据集最后面。...这些函数一个关键属性就是向量化:它必须使用一组向量值作为输入,然后返回相同长度数值作为输出。我们没有办法将所有的函数都列举出来,这里选择一些被频繁使用函数。...()联合使用是我们最常用dplyr工具:进行分组汇总。...这个代码写有点令人沮丧,尽管我们不关心中间变量(临时变量),但我们却不得不创造这些中间变量存储结果数据框。命名是一件非常困难事情,它会降低我们分析速度。...如果输入不去除缺失值,结果必然是缺失值。幸运是,所有的聚集函数都有na.rm参数,它可以在计算之前移除缺失值。

2.5K20

「R」数据操作(四):初学者学习tidyverse

资料来源:DataCamp tidyverse是一组处理与可视化R包集合(人称“极乐净土”,但我并不喜欢这个称呼),其中ggplot2与dplyr最广为人知。...R函数编程 tibble - 新一代数据框 stringr - 提供函数集用来处理字符数据 forcats - 提供有用工具用来处理因子问题 有几个包没接触过,R包太多了,这些强力包还是有必要接触和学习下使用...::filter() masks stats::filter() ## x dplyr::lag() masks stats::lag() 有用函数 # tidyverse与其他包冲突 tidyverse_conflicts...) 汇总 summarize()函数可以让我们将很多变量汇总为单个数据点。...还可以一次性汇总多个变量 iris %>% filter(Species == "virginica") %>% summarize(medianSL = median(Sepal.Length

1.6K30

R语言 | 第一部分:数据预处理

c1","c2","c3"))) m2 <- matrix(1:6,nrow=2) #共6个元素,分2行,每行3个元素,未指定行名和列名 m3 <- matrix(1:6,ncol=3) #共6个元素,结果与创建形式...2相同m4 <- matrix(nr=2,nc=3) #未指定元素数据,默认为NA,2行3,nr是nrow简写,nc是ncol简写,R能识别 #数组 mydata <- array(1:12,c(...= c("Male", "Man" , "Lady", "Female"),labels = c("Male", "Male", "Female", "Female")) #数据列表:可用于合并多个不同类型数据字段...【进阶】数据库相关dplyr install.packages("dplyr") library(dplyr)】 dplyr包最常使用函数主要包括以下几个:变量筛选函数:select数据筛选函数:filter...排序函数:arrange变形函数:mutate汇总函数summarize分组函数:group_by管道连接符:%>%随机抽样函数:sample_n, sample_frac

1.1K00

Power BI: 理解SUMMARIZE

SUMMARIZE执行两个操作:按分组和添加值。使用SUMMARIZE对表进行分组是一个安全操作,而使用SUMMARIZE添加新可能会导致难以调试意外结果。...为了正确理解 SUMMARIZE,您必须了解集群工作原理,行上下文和筛选上下文存在有什么影响,以及扩展表在集群中作用。...函数进行新建列计算时,一定要注意它筛选器并不仅仅是集群标头,它包含表上所有。...在评估新期间,SUMMARIZE 对集群进行迭代并生成: 包含簇头行上下文; 一个筛选上下文,包含集群中所有,包括集群标题。 这种独特行为给本来就很复杂函数增加了一些混乱。...3 ADDCOLUMNS 和 SUMMARIZE组合 先说结论,建议不要使用SUMMARIZE函数来增加扩展,而是使用ADDCOLUMNS 和 SUMMARIZE组合。

68730

R语言 | 第一部分:数据预处理

c1","c2","c3"))) m2 <- matrix(1:6,nrow=2) #共6个元素,分2行,每行3个元素,未指定行名和列名 m3 <- matrix(1:6,ncol=3) #共6个元素,结果与创建形式...2相同 m4 <- matrix(nr=2,nc=3) #未指定元素数据,默认为NA,2行3,nr是nrow简写,nc是ncol简写,R能识别 #数组 mydata <- array(1:12,c...= c("Male", "Man" , "Lady", "Female"),labels = c("Male", "Male", "Female", "Female")) #数据列表:可用于合并多个不同类型数据字段...【进阶】数据库相关dplyr install.packages("dplyr") library(dplyr)】 dplyr包最常使用函数主要包括以下几个: 变量筛选函数:select 数据筛选函数...:filter 排序函数:arrange 变形函数:mutate 汇总函数summarize 分组函数:group_by 管道连接符:%>% 随机抽样函数:sample_n, sample_frac

91920
领券