开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

使用Dplyr添加比例列

在使用Dplyr包添加比例列时，你可能想要根据某个现有列的值来计算新列的比例。以下是一个基本的示例，展示了如何使用Dplyr在R中实现这一点。

假设我们有一个数据框（data frame）df，其中包含一个名为value的列，我们想要添加一个新列proportion，该列的值是value列的值除以value列的总和。

library(dplyr)

# 示例数据框
df <- data.frame(
  group = c("A", "A", "B", "B"),
  value = c(10, 20, 30, 40)
)

# 使用Dplyr添加比例列
df <- df %>%
  group_by(group) %>%
  mutate(proportion = value / sum(value)) %>%
  ungroup()

print(df)

在这个例子中，我们首先使用group_by函数按group列对数据框进行分组。然后，我们使用mutate函数创建一个新列proportion，其值是当前组的value列的值除以该组value列的总和。最后，我们使用ungroup函数取消分组，以便后续操作不受分组影响。

输出结果将是：

# A tibble: 4 x 3
  group value proportion
  <fct> <dbl>      <dbl>
1 A        10       0.333
2 A        20       0.667
3 B        30       0.429
4 B        40       0.571

在这个例子中，我们计算了每个组内value列的比例。

如果你遇到了问题，比如比例计算不正确，可能的原因包括：

分组错误：确保你正确地使用了group_by函数，并且分组依据的列没有错误。
数据类型问题：确保value列中的数据是数值型，而不是字符型或其他非数值型。
数据框结构问题：确保你的数据框结构符合预期，没有缺失值或其他异常。

解决这些问题的方法包括：

检查并修正分组依据的列。
使用as.numeric函数或其他类型转换函数确保数据类型正确。
使用is.na函数检查并处理缺失值。

参考链接：

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

dplyr包summarize的使用

cyl有4,6,8三种取值，而gear有3,4,5三种取值，应该一共有9组，但我们这里只有8组，原因是cyl=8,gear=4的没有，默认不填补缺失值就会被 d...

9192 0

使用 ImageJ 为你的照片添加比例尺

使用前，你需要准备以下内容带有任意已知长度参照物的图片 ImageJ 所谓已知长度参照物，比如在图中放把尺子，又或者给盆栽拍照的时候，已知盆栽的直径等等，不管是拍照前就知道参照物的长度，还是拍照后再去测量参照物的长度...2制作比例尺放大 → 选择已知长度区域 → 划线。按下图说明点击，设置比例尺。调整划线的实际长度和单位。...接下来在你想要的位置划线 → 比例尺选择比例尺的长度、字体大小、颜色、背景、位置等，如果整个文件夹的图片都是同样的比例尺，选择 Label all slices 即可对所有图片设置相同的比例尺。

1.7K2 0

【D3使用教程】(3) 添加比例尺

而D3中，比例尺要做的就是将数据值映射为可视图形中的可替代值得手段。 D3中，比例尺是一种函数，带参数。你可以定义任意多个比例尺函数。本节中，我们将讨论线性比例尺。...（1）概念首先，我们先定义一个数据集： let dataset = [100,200,300,400,500]; 在使用比例尺之前，我们需要理解两个概念：输入值域：指可能的输入值的范围。...) .attr("r",function(d){ return rScale(d[1]); }); //添加标签...； ordinal 使用非定量值（如类名）作为输出的序数比例尺； d3.time.scale() 针对日期和时间值得一个比例尺方法，可以对日期刻度作特殊处理； category10\category20...下一节中，我们会给散点图添加上数轴坐标，更形象地从二维视角表现散点图。

3451 0

「R」dplyr 包使用

function处理 summarise_at()对特定的列进行function处理 summarise_if()对所有属于一个类型的列进行处理 group的用法 group_by(.data, ......举例：注意，把列的内容转换成行名的时候，该列的内容不能够存在重复 > b <- column_to_rownames(iris, var = "Species") Error in `.rowNamesDF...y中其他列的内容根据索引组合上去。...bind_rows(..., id = NULL) id是增加的新列的名字 intersect(x, y, ...)取得同时出现在x和y两个数据框中的行 ?...union(x, y, ...)整合出现在x数据框中或y数据框中的，去除了两个数据框中重复的部分，想要保留重复的话使用union_all() ?

1.1K2 0

PBI-基础入门：添加列与新建列（计算列）

小勤：在Power BI里怎么增加一列？大海：在Power BI里增加列有2种方法，一种是咱们在学Power Query里的“添加列”方法，还有一种是在PowerPivot里的新建“计算列”方法。...具体操作方法如下：在查询编辑中添加列：直接在Power BI Desktop界面中新建列：小勤：啊。Power BI真是两这个的完全组合啊。这两者之间有什么不同吗？...但在构造的时候是有以下差别的：查询编辑器里添加列用的是Power Query的知识，一般情况下，Power Query在这方面的功能比较强一些，尤其是做文本的相关处理时。...而在Power BI Desktop里用新建（计算）的方式，使用的是Power Pivot中的相关方法，总体看来相对弱一些。...但是，新建计算列的方法有个好处，是可以直接引用计算度量的相关结果，这一点是用PQ添加列方法做不到的。小勤：那该怎么决定到底用哪一种方法呢？大海：我很少纠结这个问题，反正觉得哪个用起来方便就用哪个。

7.6K3 0

1.13 PowerBI数据准备-添加列，按示例添加列，体验智能快感

如果对PowerQuery的M语言还不熟悉，添加列的时候可以先尝试按示例添加列；即便已经很熟悉M语言了，也可以偷个懒，用按示例添加列可以省去敲繁琐的代码。...微软硬生生地翻译为“示例中的列”，实际上翻译成“按示例添加列”更恰当。...操作步骤STEP 1 点击菜单栏添加列下的示例中的列，选从所有列或从所选内容，让计算机按照所有列/所选列去理解你的意思，通常选后者，更容易让计算机找到规律。...举例按示例添加列可以实现很多需求，挑选几个举例如下：1 条件判断，按指定条件返回相应的值。...举例1：按值赋值蔬菜后面输入1，水果后面输入2，返回结果，如下：举例2：数字分组67后面输入60-69，36后面输入30-39，返回结果，如下：2 内容修整，引用特定列，包括修整、清理和大小写转换。

730 0

R语言第二章数据处理⑥dplyr包（1）列选取目录选取列

. ---- 选取列选取列：基础部分如果目的是选择其中几列，只需在select语句中添加列的名称即可。添加它们的顺序将决定它们在output中的显示顺序。...如果你想添加很多列，可以通过使用：提高工作效率，取消选择甚至取消选择列并重新添加它来进行选择。...甚至可以取消所有列，然后重新添加其中某列。下面的示例代码取消选择从name到awake的所有列，但重新添加列'conservation'，即使它是取消选择的列的一部分。...根据列名特点选择列如果你有很多具有类似列名的列，你可以通过在select语句中添加starts_with（），ends_with（）或contains（）来使用匹配。...根据正则表达式选择列以上的辅助函数都是使用精确的模式匹配。如果你有列名模式并不精确相同，你可以在matches（）中使用任何正则表达式。

1.2K2 1

使用dplyr进行数据转换

library(nycflights13) library(tidyverse) dplyr最常用的5个函数： • 按值筛选观测(filter())。...如果列名不只一个，那么就使用后面的列在前面排序的基础上继续排序 arrange(flights, year, month, day) 使用 desc() 可以按列进行降序排序: arrange(flights..., desc(arr_delay)) select 1.使用select()选择列 # 按名称选择列 select(flights, year, month, day) # 选择“year”和“day”...之间的所有列(包括“year”和“day”) select(flights, year:day) # 选择不在“year”和“day”之间的所有列(不包括“year”和“day”) select(flights..., -(year:day)) mutate 使用mutate()添加新变量 flights_sml <- select(flights, year:day,ends_with("delay

9721 0

PQ基础-数据转换4：删列、移列、添加索引列

本文通过一个例子，综合体现常用的删列、移列、添加索引列操作方法。数据样式及要求如下：要求： 1. 删除状态列； 2....将货币列移动到合同总金额的后面； 3. 添加以1为起始的索引列。...Step-1：获取数据 Step-2：删除列 Step-3：移动列 Step-4：添加以1为开始的索引列 Step-5：上载数据

1.7K4 0

使用dplyr包对表格整理

R自带的对数据框添加新的行或列函数为cbind()和rbind()，对应于dplyr包的bind_cols()和bind_rows()。使用这两个函数要求数据能很好的对应。...x y 1 g 2 2 b 5 按行合并 df_rbind<-bind_rows(df1,df3) > df_rbind x y 1 a 1 2 b 2 3 c 3 4 g 2 5 b 5 按列合并...df_colbind x y z g 1 a 1 B 2 2 b 2 D 5 3 c 3 H 3 bind_rows/bind_cols()还可以合并列表前提是两个列表结构一样，比如按行bind则要求列数一样

6931 0

Power Query 系列 (07) - 添加列

本篇接着介绍如何在 PQ 中添加列。添加列是很重要的一个操作，在 PQ 的查询编辑器界面，有一个专门【添加列】功能区。在讲解添加列的过程中，我们会逐步介绍一些相关知识点和 PQ 的操作细节。...切换到【添加列】功能区，点击【条件列】，先增加一列，列名为 "Chinese"，这一列存储学生的语文成绩。注意下面界面中，输出的地方要选择 Score 这一列，而不是输入一个值。...切换到【添加列】功能区，点击【自定义列】，进入设置自定义列界面。...[Score] else null), 已添加条件列1 = Table.AddColumn(已添加条件列, "Math", each if [Subject] = "数学" then [Score...] else null), 已添加条件列2 = Table.AddColumn(已添加条件列1, "English", each if [Subject] = "英语" then [Score]

2.7K5 1

使用refGenome加上dplyr玩转gtf文件

The GENCODE gene sets被其他项目作为参考而广泛使用(如 1000 Genomes).

1.7K2 0

R代码|dplyr包的使用示例

dplyr包的使用例子。...mean_income ) ) %>% spread(key = "year", value = "mean_income") 温馨提示：第一步：运行一边代码，掌握相应的包和函数使用

1.6K3 0

GridView添加新列并绑定控件

1、GridView添加新列 2、新列里添加控件 3、控件绑定字段 4、创建控件事件（不能是click事件，关联字段触发的事件要创建Command事件）点击控件右上角的小三角，【编辑列】 ?...选择TemplateField空白字段，然后添加，在邮编找到HeaderText（表头名称）输入想要的名字。 ? 效果： ? 然后【编辑模板】 ? 这里可以拖入控件， ? ?

1.1K1 0

函数周期表丨添加列

ADD表示增加的意思；COLUMNS表示列。因此这个函数表示为表添加一个新列。按照微软的划分属于“表函数”。之前白茶曾经写过一篇关于这个函数的文章。...传送门：《基础手札丨创建表》语法 DAX=ADDCOLUMNS(, , [, , ]…) 参数 table：需要添加新列的表...name：新列的名字。 expression：表达式。返回结果包含原始列和新增列的一个新表。...@高飞老师是这样说的：ADDCOLUMNS不保留添加列的数据沿袭。按照白茶的个人理解，数据沿袭大概率指的就是上下文的问题。...但是考虑到SUMMARIZE性能的问题，还是建议小伙伴使用前者。毕竟，如果一个Dashboard刷新半天也没个结果，那么我们的努力可能就会白费，注意性能问题。

1.4K3 0

R语言第二章数据处理⑦dplyr包（2）列处理目录列名

根据预先确定的列名选择列还有另一个选项可以避免连续重新输入列名：one_of（）。您可以预先设置列名，然后在select（）语句中通过将它们包装在one_of（）中或使用!!运算符来引用它们。...如果你有日期列，你可以加载lubridate包，并使用is.POSIXt或is.Date。...如果你只是想将几列移到前面，你可以在之后使用everything（）这将简便地添加所有剩余的列。...如果要保留所有列，因此不能使用select（）语句，可以通过添加rename（）语句来重命名。...格式化所有列名 select_all（）函数允许更改所有列，并将函数作为参数。如果想以大写形式获取所有列名，可以使用toupper（），同样可以使用小写tolower（）。

1.8K4 0

hive中常量列的添加和查询

在正常应用场景中，常常会从HIVE中直接获取某个DATAFRAME，这个dataframe除了与数据表中某些字段的提取，还往往会涉及到一些常量列的添加，用以如区分数据等场景。...就实现了在某个表的原有字列后面添加a, hours两个字段。且这两个字段的数值都为常量。效果如下：

1.2K3 0

ant Design pro Table列表添加列颜色

ysk', align: 'center', width: '100px', className: `${styles.columnTwo}`, // 添加这个

1.9K2 0

MySQL如何给JSON列添加索引（二）

（一）》，我们简单介绍了MySQL中JSON数据类型，相信大家对JSON数据类型有了一定的了解，那么今天我们来简单看下如何在JSON列上添加索引？ InnoDB支持虚拟生成列的二级索引。...在虚拟列上使用二级索引时，由于在操作期间INSERT和 UPDATE操作期间在二级索引记录中实现虚拟列值时要执行计算，因此要考虑额外的写入成本。...在虚拟列上添加或删除二级索引是就地操作。通过索引生成列以提供JSON列索引 JSON 不能直接对列进行索引。...要创建间接引用此类列的索引，可以定义一个生成列，该列提取应建立索引的信息，然后在生成的列上创建索引，如下所示：说明：8.0和5.7都支持在生成列上添加索引 mysql>CREATE TABLE jemp...；当EXPLAIN在SELECT包含一个或多个使用->or->> 运算符的一个或其他SQL语句上使用时，这些表达式将使用JSON_EXTRACT()和（如果需要）转换为它们的等效项JSON_UNQUOTE

7.4K1 1

1.14 PowerBI数据准备-添加条件列，给维度添加排序列

解决方案在PowerBI中，可以用一个序号列为要排序的列的每个值标记一个数字序号，然后再让它按照序号列排序。...这样，就可以使用按列排序功能为月份名称或者星期几排序了。区域名称也需要序号列，优先在数据源中自带排序列，如果没有权限修改数据源，或者想自主控制顺序，可以在PowerQuery中添加条件列。...操作步骤STEP 1 点击菜单栏添加列下的条件列，在跳出的对话框中，新列名命名为大区序号，输入各个大区对应的序号。图片STEP 2 将生成的大区序号列数据类型改为整数。...STEP 3 关闭并应用后，在数据窗格中选中大区列，点击菜单栏列工具下的按列排序，选择大区序号。这样，按照大区升序排列的时候，就会按照自定义的排序方式排列了。...拓展有时候维度表是从事实表中提取的，建议这个提取操作在PowerQuery中使用分组依据实现，不建议使用DAX的DISTINCT实现，因为用DAX生成的计算表虽然也能实现新建计算列进行条件赋值，但是点击按列排序的时候会报错

790 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭