文章/答案/技术大牛

发布

如何重塑每个类别有两个度量列的数据集(从长到宽)，而不需要在R中进行额外的计算

在R中，你可以使用tidyr包中的pivot_wider()函数来将数据集从长格式重塑为宽格式。这个函数特别适用于每个类别有两个度量列的情况。下面是一个基本的示例，说明如何使用pivot_wider()来完成这个任务。

基础概念

数据重塑是指改变数据集的结构，以便于分析和可视化。长格式数据集通常包含多个观察值，每个观察值占据一行，而宽格式数据集则将同一类别的多个观察值放在同一行中。

类型与应用场景

时间序列数据：将时间序列数据从长格式转换为宽格式，以便于分析趋势和模式。
实验设计：在实验设计中，将每个实验条件下的多个测量值放在同一行中。
调查数据分析：将调查问卷中的多个问题答案放在同一行中。

示例代码

假设我们有一个长格式的数据集df，其中包含三个变量：category（类别）、metric1（度量1）和metric2（度量2）。我们希望将这个数据集重塑为宽格式，其中每个类别占据一行，度量列分别对应于不同的度量。

# 安装并加载tidyr包
install.packages("tidyr")
library(tidyr)

# 创建一个示例长格式数据集
df <- data.frame(
  category = c("A", "A", "B", "B"),
  metric1 = c(10, 15, 20, 25),
  metric2 = c(30, 35, 40, 45)
)

# 使用pivot_wider()函数重塑数据集
wide_df <- pivot_wider(df, names_from = category, values_from = c(metric1, metric2))

# 查看重塑后的数据集
print(wide_df)

输出结果

# A tibble: 2 × 4
  metric1_A metric1_B metric2_A metric2_B
      <dbl>     <dbl>     <dbl>     <dbl>
1        10        20        30        40
2        15        25        35        45

遇到的问题及解决方法

如果在重塑过程中遇到问题，例如某些类别没有对应的度量值，pivot_wider()函数会自动填充缺失值为NA。如果你希望为缺失值指定一个特定的值，可以使用values_fill参数。

wide_df <- pivot_wider(df, names_from = category, values_from = c(metric1, metric2), values_fill = 0)

这将把所有缺失值替换为0。

总结

通过使用tidyr包中的pivot_wider()函数，你可以轻松地将长格式数据集重塑为宽格式，而无需进行额外的计算。这种方法适用于各种数据分析场景，特别是当每个类别有两个度量列时。

页面内容是否对你有帮助？

有帮助

没帮助

如何重塑每个类别有两个度量列的数据集(从长到宽)，而不需要在R中进行额外的计算

我有一个长格式的数据集(参见下面的代码来生成这个数据集)： A 20 5 30我想要准备演示文稿(带有RMarkdown的HTML)，所以我需要将它转换为wide，每个week都有average和percent，如下所示： 20我不需要执行任何计算，只需以不同的格式组织

浏览 32提问于2018-08-04得票数 3

回答已采纳

2回答

具有重复行名称的长到宽

、、

我不认为这个特别的问题以前在论坛上出现过，但是如果这是一个重复的问题，请告诉我正确的方向！2 percentage on financial aid 1请注意，对于每个我希望在从长到宽的重塑过程

浏览 2提问于2017-06-23得票数 1

1回答

如何在条件语句中匹配列名而不是列值来计算新列

、、、、

我有一个数据集，其中有几个度量/变量。这些变量存储在不同的列中，名称描述了它们的值。为了进行数据分析，我在行中添加了这些变量名(度量名称)，以便根据数据集中另一个变量的值在列中排列我的交叉表视图。我的问题是，我想添加一个额外的虚拟列(变量)，其中

浏览 3提问于2020-10-22得票数 1

3回答

R-从长到宽重塑时的"Error in varying[，i]：in of dimensions“

、

我正在尝试使用R中的reshape()函数从长到宽重塑我的数据帧。我能够使用对另一个数据集从宽到长进行转换，但是当使用相同的指导方针进行相反的操作时，我总是收到这个错误，我不明白：以下是我的数据

浏览 4提问于2018-08-19得票数 0

1回答

从长到宽重新塑造数据集(或用信息丰富主数据集的不同方法)

、

来自STATA的我很难重塑我的数据，或者我在如何处理python /a ML问题上弄错了。我有多个数据集，我将在这里简要描述： +-----------------------------------------| 20 green | 5. | 20 blue

浏览 4提问于2020-11-29得票数 1

回答已采纳

2回答

具有非聚集测度列的SSRS行组

、

我找不到其他和我的问题完全一样的问题，所以是时候问了。我有一份2016年SSRS报告。它有一个地区等级(州、市、地点)。它有一个度量列，它是在存储过程中执行的计算。由于计算的性质，城市的计算值必须在存储过程中独立执行。它并不是城市中的位置的简单聚合，所以不能简单地在报告中进行聚合。我需要报告来扩展和收缩区域层

浏览 6提问于2021-09-15得票数 1

1回答

R_a旋转长结果中的整形

、、

**问题**key.Result 使用来自jan_vic_elec数据集的2列(D和T)。将重塑的对象命名为一个新重塑的列，该列具有“键”列，而两个变量D和T定义的D名称T列的值为‘value’，您应该有一个具有以下三

浏览 4提问于2022-03-19得票数 0

4回答

(行)对组合过滤

、、、、

我有一个长格式的数据，我想要过滤对基于独特的组合值。个人1看到两个物体，都是蓝色的；个体2看到一个红色物体和一个黄色物体，依此类推。 id type4 2 yellow8 4 yellow 它应该保持第二和第四请注意，它并没有保持应

浏览 0提问于2018-01-12得票数 4

回答已采纳

1回答

从单个表列创建多个度量值

我是SSAS OLAP Cube的新手。我需要从一个表列创建3个度量。这是桌子，因此，我在Datasource视图中使用命名查询创建了3个表。但是，它限制了为3个度量创建3个度量组。有什么简单的方法吗。

浏览 2提问于2015-02-18得票数 0

回答已采纳

1回答

如何在时间序列中叠加geom_area函数

、

我对R非常陌生，很抱歉，如果这是非常简单的事情。堆叠这些区域图的最佳方法是什么？., fill="Red")) +这是添加上下文的数据结构

浏览 0提问于2020-09-12得票数 0

回答已采纳

1回答

取代统计汇总系统

、、

我们目前在MySQL下有一个数据库，将汇总的统计数据存储在不同的表中(最近几个小时、几个小时、几天、几个月)。根据数据所需的新鲜度，以不同的速率运行的工作人员会更新这些表。我们的第一个原型使用Dataflow (有点像MapReduce，但在流中工作)为部分数据预计算聚合，并将这些聚合放在BigTable中，并将原始事件(分区)放置在BigQ

浏览 0提问于2017-03-01得票数 3

1回答

SSRS表达式不会从查找中读取值

、

My problem: I有一个SSRS报告，该报告按度量、设施和month_end dt分组。该报告使用分组显示每个月及其相应的计算值，但YTD不起作用。YTD有点复杂，因为我为YTD使用的日期范围按度量名进行更改，所以不是所有的12个月都包括在内，所以我让它在使用SSRS数据集之前在SQL中计算YTD所需的值，但我认为这与我如何存储它和如何分组有关，这会阻止我

浏览 3提问于2021-03-19得票数 1

回答已采纳

1回答

计算的属性-最小和最大有效日期

、、

我们在具有历史值的表(维度)中有一些数据。像这样(小例子) ProductId是我们的主键(然后是唯一的)颜色和类型是我们的历史价值(1)如果他们只想看到代码(在我们的示例中是“CAR”)，结果将是：(2)如果他们想看到代码和颜色：我们可以拥有的所有

浏览 3提问于2018-01-03得票数 0

回答已采纳

1回答

如何将我们自己的文本数据加载到scikit中以进行MeanShift集群？

、、

我计划加载自己的一组非结构化文本数据，如下所示：基本上，程序并不关心给定数据的结构。我已经编辑了MeanShift示例中给出的代码，以便我的代码加载我自己<em

浏览 4提问于2014-03-31得票数 1

回答已采纳

2回答

R:如何在我的dataframe中从另一个基于匹配变量/观察的逻辑测试响应的数据中导入一个变量？

、

最后一个是来自开发计划署(人类发展指数)的链接(我不能发布这个链接，因为我没有足够的“声誉”来发布两个以上的链接，但是您可以很容易地通过快速的谷歌搜索找到它)： 'data.frame': 189我要做的是从第二个(SP.POP.TOTL)和第三个data.frames (X2005、X2011、X2012、X2013、X2014)中提取一些关键变量到我的第一个data.frame (基于难民署我成功地使用了第二个data.fr

浏览 1提问于2016-12-26得票数 1

回答已采纳

1回答

将函数应用于数据帧以修剪列表环境R中的空列

我是一个天真的R用户，正试图接受“apply”系列函数，由于数据集的复杂性，我现在需要使用这些函数。在进行一系列回归分析之前，我有一个大的、参差不齐的数据框架，我希望对其进行重塑。它通过具有交错的描述性数据(字符)行而变得更加复杂。到目前为止，我的方法是使用一个因子将数据框分成等行长的集合(即列表)，然后尝试

浏览 0提问于2015-05-27得票数 1

1回答

实现分层聚类的数据结构

、、、、

如果我要实现一种分层聚类算法，例如在C/C++或Java中-考虑到计算集群之间和内部距离的函数- 1。我将选择什么(以及其他选项)来实现数据结构，即将计算出的集群的结果存储在邻近度量中的每个“传递”中，而邻近度量定义为下面的n^2。如果我使用自顶向下的数据结构，而不

浏览 2提问于2014-01-22得票数 3

1回答

按工作日计算的月平均新用户数量

我的数据由维度fully_enrolled_at和度量值new_users组成。因此，这不需要数据集，因为您可以sum()的任何日期和度量都可以。我创建了以下两个计算：days_in_month = DATEDIFF('day',MIN(DATETRUNC('month',[fully_enrolled_at])),MAX(DATET

浏览 0提问于2018-11-02得票数 0

1回答

在数据集中调用withColumn的成本是多少？

、、

在我使用RDDs的几个项目之后，我开始使用数据集。我正在使用Java进行开发。据我所知，列是不可变的--列没有map函数，映射列的标准方法是使用withColumn添加列。我的问题是，当我打电话给withColumn时，到底发生了什么？有表演罚款吗？我应该尽量少打withColumn电话，还是没关系？支持的问题:当我调用任何其他的行/列</em

浏览 1提问于2017-12-12得票数 1

2回答

R统计中简单的数据透视表类型转换

我已经尝试学习R有一段时间了，但我的知识还没有达到一个像样的水平。我会在最后到达那里，但我现在手头拮据，不知道你是否可以帮我做一个快速的“转换”类型的作品。3,12/06/2014,38.131,20/12/2013,20.51 因此，正如您所看到的，数据中可以有多个in，但是一个人的每个日期和贡献金额都是唯一

浏览 0提问于2013-04-14得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何重塑每个类别有两个度量列的数据集(从长到宽)，而不需要在R中进行额外的计算

基础概念

相关优势

类型与应用场景

示例代码

输出结果

遇到的问题及解决方法

总结

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐