在tidyverse中分隔新列中的重复数据

在tidyverse中，可以使用separate()函数来分隔新列中的重复数据。

separate()函数是tidyverse中的一个数据处理函数，用于将一个包含重复数据的列拆分成多个新列。它的语法如下：

separate(data, col, into, sep = "[^[:alnum:]]+", remove = TRUE, convert = FALSE, ...)

参数说明：

data：要操作的数据框（data frame）或数据表（tibble）。
col：要拆分的列名或列索引。
into：指定新列的名称，可以是一个字符向量，用于指定多个新列名。
sep：指定拆分的分隔符，默认为非字母数字字符。
remove：指定是否移除原始列，默认为TRUE，即移除原始列。
convert：指定是否将新列的数据类型转换为适当的类型，默认为FALSE。

使用separate()函数可以将包含重复数据的列拆分成多个新列，每个新列中的数据都是原始列中的一个重复数据。这在数据清洗和数据分析中非常有用。

以下是一个示例：

library(tidyverse)

# 创建一个包含重复数据的数据框
data <- tibble(col = c("A_B", "C_D", "E_F"))

# 使用separate()函数拆分新列
data <- separate(data, col, into = c("col1", "col2"), sep = "_")

# 输出结果
print(data)

输出结果如下：

# A tibble: 3 x 2
  col1  col2 
  <chr> <chr>
1 A     B    
2 C     D    
3 E     F

在这个例子中，我们使用separate()函数将包含重复数据的col列拆分成了两个新列col1和col2，新列中的数据分别为原始列中的重复数据。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云云服务器（CVM）：提供弹性计算能力，满足各种业务需求。
腾讯云对象存储（COS）：提供安全、稳定、低成本的云端存储服务。
腾讯云数据库（TencentDB）：提供高性能、可扩展、安全可靠的数据库服务。
腾讯云人工智能（AI）：提供丰富的人工智能服务，包括图像识别、语音识别、自然语言处理等。
腾讯云物联网（IoT）：提供全面的物联网解决方案，帮助用户快速构建物联网应用。
腾讯云移动开发（Mobile）：提供移动应用开发和运营的一站式解决方案。
腾讯云区块链（Blockchain）：提供安全、高效、易用的区块链服务，支持多种场景应用。
腾讯云音视频（VOD）：提供音视频处理、存储和分发的全套解决方案。
腾讯云云原生应用引擎（TKE）：提供全托管的容器化应用服务，简化应用部署和管理流程。

以上是腾讯云提供的一些相关产品，可以根据具体需求选择适合的产品来支持云计算和开发工作。

通过拆分` one‘列、查找唯一值、对它们进行排序、删除某些值并将它们组合回一个字符串来创建新列

r、dataframe、dplyr、tidyverse、data-manipulation

我在R中工作，使用tidyverse和dplyr函数生成新列，但是当我试图在字符串列中找到唯一值时，我遇到了一个墙。下面是对这个问题的详细描述。设置假设我有一个名为df的tibble，其中有一个名为col1的chr列，它包含字符串。实际上，这些字符串是由逗号(", ")分隔的值列表。下面是df的样子： library(tidyverse) library(dplyr) df = data.frame(id=c(1,2,3,4,5), col1=c("a, b, x, a","b, b","c, b,

浏览 3提问于2022-02-01得票数 1

回答已采纳

1回答

R Data.table在列的值中用分隔的值突变一个表？

r、data.table、dplyr、tidyr

我有这样的数据 > a<-data.table(col1=c(1,2,3),col2=c("1;2","11;22","111;333")) > a col1 col2 1: 1 1;2 2: 2 11;22 3: 3 111;333 我想把它写成以下格式 col1 col2 1: 1 1 2: 2 11 3: 3 111 4: 1 2 5: 2 22 6: 3 333 对于这种情况，像a

浏览 2提问于2017-07-24得票数 0

4回答

怎么买云服务器？

云服务器、5折上云

请描述您的问题标题：腾讯云云产品新购特惠，五折上云！地址：https://cloud.tencent.com/act/first_purchase?utm_source=portal&utm_medium=cdb&utm_campaign=firstpurchase&utm_term=0110 浏览器信息 Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36

浏览 477提问于2018-03-12

3回答

导入数据，列是字符空间。

r、import

我有一个包含数据的文件，我需要将这些数据导入到dataframe中，但是文件的设置非常糟糕。我试图导入的文件是一个包含344个字符的列表(32列，445k行)。每一列都是字符空间的特定范围。列1是字符空间1:2。列2是字符空间3:6。第3列是字符空间7:20等等。数据示例： the.data <- list("32154The street", "12546The clouds", "23236The jungle") 我想要它看起来像 col1 col2 col3 32 154 The street 12

浏览 1提问于2018-01-19得票数 2

回答已采纳

2回答

如何将数据帧元素中的两列逐元素组合？

r、dataframe

浏览 0提问于2018-10-13得票数 1

回答已采纳

1回答

在R中的dataframe中向另一个值添加一个不同的值(按组)

r、dataframe、grouping

我有两个dataframes，如果dataframes的值等于另一个列的值，我想将一个dataframe中的列的值减去另一个。我有两个数据格式A和B，它们类似于以下内容： [A] Col1 Col2 1 cat 2 dog 3 bird 4 cat 5 dog [B] Col1 Col2 [cat] 1 [dog] 2 [bird] 3 我希望能够添加值A$Col1 + B$Col2，如果A$Col2匹配[B]的标记，并创建一个具有与[A]中行长度相同的结果的列表我试过这个代码 (A$Col1-B$Col2

浏览 0提问于2019-06-13得票数 0

回答已采纳

1回答

在r列中转换带有逗号分隔值的数据

r、dplyr

我有一个数据文件，例如 COL1 COL2 Canis_lupus 1_Group367,4_Group89,70_Group900 Danio_rerio 8_Group78 Felis_cattus 6_Group9,90_Group97 我想把它转化为： COL1 Groups Value Canis_lupus Group367 1 Canis_lupus Group89 4 Canis_lupus Group900 70 Danio_rerio Group78 8 Felis_cattus Group9 6

浏览 3提问于2021-12-30得票数 2

回答已采纳

1回答

如何将列作为变量或索引传递给tidyr：：分离

r、tidyr

在尝试将列名作为索引或变量传递给tidyr::separate时出错。建立图书馆和数据： library(tidyr) library(dplyr) x <- data.frame(col1 = 1:4, col2 = c("a,b,c","d,e,f","g,h,i","j,k,l")) sep <- "," colnameVar <- "col2" 这些工作(以dplyr计)： x %>% select(col2) %>% name

浏览 1提问于2016-07-28得票数 1

回答已采纳

2回答

从宽到长的w/偶合列:是否有更多的R方式来做到这一点(即-不使用for循环)？

我有一个如下所示的数据集： phrase wo1sp wo2sp wo3sp wo1sc wo2sc wo3sc hello dan mark todd 10 5 4 hello mark dan chris 8 9 4 goodbye mark dan kev 2 4 10 what kev dan

浏览 2提问于2018-12-20得票数 3

回答已采纳

3回答

将计算列添加到dataframe R

r、dataframe

我想从一个数据框中计算一些列的统计数据(均值、最小值、最大值、标准差等)，并将这些值存储为另一个数据框。下面是一个示例： >foo Col1 Col2 Col3 Col4 1 1 6 10 60 2 2 7 20 70 3 3 8 30 80 4 4 9 40 90 5 5 10 50 100 例如，我想将Col1和Col3的平均值和最小值存储在数据帧中，如下所示： >bar Col1 Col3 Mean 3

浏览 36提问于2018-06-05得票数 4

回答已采纳

2回答

提取具有数据帧级别的行

r、dataframe

我有这样的数据： df = data.frame(col1=c(1,1,1,2,2,2,3,3,3), col2=as.factor(c('a','b','b','a','a','a','b','a','b'))) 然后提取与每一列相关的所有类别(级别)： levels_df = expand.grid(unique(df$col1), unique(df$col2)) colnames(levels_df)=c(

浏览 1提问于2022-01-11得票数 1

3回答

空格上的r分隔列和替换数据

r、string、dataframe、split

我有一个像这样的数据文件：数据 structure(list(col1 = c("Arizona", "Florida", "Montreal"), col2 = c("5½ -130", "5 -135", "5½ -125")), row.names = c(NA, -3L), class = "data.frame") Col1 Col2 Arizona 5½ -130 Florida 5 -135 Montreal 5½ -125 我需要它看起来像这样(将Co

浏览 5提问于2020-08-07得票数 0

回答已采纳

2回答

应用tidyr：：在多列上分离

r、dataframe、lapply、tidyr

我想在dataframe中迭代列，并将它们拆分为基于分隔符的列。我使用的是tidyr::separate，当我一次做一个列时，它可以工作。例如： df<- data.frame(a = c("5312,2020,1212"), b = c("345,982,284")) df <- separate(data = df, col = "a", into = paste("a", c("col1", "col2", "col3

浏览 4提问于2017-02-26得票数 8

回答已采纳

9回答

删除特定列中行中的重复元素

r、regex、dataframe、dplyr、subset

我有像这样的数据； COL1 COL2 A,A,A 2 B 1 C,C 4 D,D,D 1 A 4 F 2 C,C 1 首先，我要删除COL1中的重复内容，然后获取： COL1 COL2 A 2 B 1 C 4 D 1 A 4 F 2 C 1 然后，将相同的COL1 字母与COL2 值相加，得到： COL1 COL2 A 6 B 1 C 5 D 1 F 2 有人想办法了吗？如果可以帮助的话，这里是dataframe： structure(list(COL1

浏览 3提问于2021-07-25得票数 5

回答已采纳

2回答

如果仅R中的数字，则删除空格并将值转换为数字

r、dplyr、number-formatting

我一直在网上找这个问题与通常的发现不同的是，我有一些列，其中包含与普通数字不同的数字和其他值。举个例子： df <- data.frame('Col1' = c('421', ' 0.52', '-0.88 ', '1.2 (ref)', ' 97 '), 'Col2' = c('0.0', '0.27,0.91', '3.0', ' 10242.3', ' 94.

浏览 4提问于2020-05-18得票数 0

回答已采纳

4回答

在数据帧中选择向量中除第一个元素之外的所有元素

r、dataframe、split、subset

我有一些数据如下： X1 A,B,C,D,E A,B A,B,C,D A,B,C,D,E,F 我希望生成一个列，它包含每个向量的第一个元素("A")，另一个列包含所有其余的值("B“、"C”等)： X1 Col1 Col2 A,B,C,D,E A B,C,D,E A,B A B A,B,C,D A B,C,D A,B,C,D,E,F A B,C,D,E,F 我尝试了以下几点： library(dplyr) testdata

浏览 5提问于2022-01-25得票数 3

回答已采纳

1回答

用多个缺失的值连接多个列

r、data-manipulation

如何将多个列的值连接到一个列中，但跳过列中/列中任何位置的缺失值？我有df，我想把它变成df2 df<- data_frame(col1 = c('', 'B', 'C', 'D', 'E'), col2 = c(1,3,'','',9), col3 = c('aa', 'bb', 'cc', '', '') ) df df2<- data_fra

浏览 3提问于2020-02-07得票数 0

回答已采纳

1回答

R中字符串的非顺序组合匹配与基于combos的折叠数据帧

r、string

我有这样的数据： table <- data.frame(col1 = c("USA", "CHN", "DEU", "DEU"), col2 = c("DEU", "DEU", "USA", "CHN"), col3 = c(100, 150, 300, 250)) col1 col2 col3 1 USA DEU 100 2 CHN DEU 150 3 DEU USA 300 4 DEU CHN 250 如何根据col1和col

浏览 0提问于2018-04-19得票数 0

回答已采纳

1回答

可变函数:对字符串进行排序并删除重复字符

r、stringr、dplyr

我知道这一定很容易，已经有可用的函数，也许是字符串，可以这样做.但我没办法找到答案。我有一个只有一列的数据文件： > df1 <- tibble(col1=c("abac", "aacabb")) > df1 # A tibble: 2 x 1 col1 <chr> 1 abac 2 aacabb 我想要创建两个新的列，这样我就可以得到： > df2 # A tibble: 2 x 3 col1 col2 col3 <chr> <chr> <chr>

浏览 5提问于2020-12-14得票数 1

回答已采纳

3回答

使用列名向量替换NA

r、dplyr、tidyr

我有一个包含NA的列的数据框架，我用replace_na替换它。问题是这些列名将来可能会改变，所以我想把这些列名放在一个向量中，然后在replace_na函数中使用这个向量。我不想一蹴而就地改变整个数据帧，只是指定的列。当我按下面的方式尝试时，代码会运行，但是它不会改变数据框架。有人能建议修改代码吗？ library(tidyverse) col1<-c(9,NA,25,26,NA,51) col2<-c(9,5,25,26,NA,51) col3<-c(NA,3,25,26,NA,51) col4<-c(9,1,NA,26,NA,51) data<-data.

浏览 0提问于2021-06-23得票数 1

回答已采纳

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在tidyverse中分隔新列中的重复数据

相关·内容

通过拆分` one‘列、查找唯一值、对它们进行排序、删除某些值并将它们组合回一个字符串来创建新列

R Data.table在列的值中用分隔的值突变一个表？

怎么买云服务器？

导入数据，列是字符空间。

如何将数据帧元素中的两列逐元素组合？

在R中的dataframe中向另一个值添加一个不同的值(按组)

在r列中转换带有逗号分隔值的数据

如何将列作为变量或索引传递给tidyr：：分离

从宽到长的w/偶合列:是否有更多的R方式来做到这一点(即-不使用for循环)？

将计算列添加到dataframe R

提取具有数据帧级别的行

空格上的r分隔列和替换数据

应用tidyr：：在多列上分离

删除特定列中行中的重复元素

如果仅R中的数字，则删除空格并将值转换为数字

在数据帧中选择向量中除第一个元素之外的所有元素

用多个缺失的值连接多个列

R中字符串的非顺序组合匹配与基于combos的折叠数据帧

可变函数:对字符串进行排序并删除重复字符

使用列名向量替换NA

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐