如何在使用data.table时从字符向量创建列名

在使用data.table时，可以通过将字符向量作为列名来创建新的列。以下是一个示例：

首先，我们需要加载data.table包：

library(data.table)

然后，我们可以使用data.table()函数创建一个data.table对象：

dt <- data.table()

接下来，我们可以使用:=操作符来创建新的列。可以使用字符向量作为列名，并指定列的值。例如，我们可以使用字符向量c("col1", "col2", "col3")作为列名，并指定列的值为1、2、3：

dt[, c("col1", "col2", "col3") := list(1, 2, 3)]

还可以使用字符向量的长度来指定列的值。例如，我们可以使用字符向量c("col4", "col5", "col6")作为列名，并将每列的值设置为字符向量c("a", "b", "c")的长度：

dt[, c("col4", "col5", "col6") := rep_len(c("a", "b", "c"), length(dt))]

以上是使用data.table时从字符向量创建列名的方法。这种方法可以让我们方便地在data.table对象中添加新的列，并使用字符向量作为列名。如果您想了解更多关于data.table的详细信息，您可以访问腾讯云的data.table产品介绍页面：data.table产品介绍。

相关·内容

《高效R语言编程》6--高效数据木匠

这是本书最重要的一章，将涉及以下内容：使用tidyr整理数据使用dplyr处理数据使用数据库使用data.table处理数据软件配置 library("tibble") library("tidyr...列改名 rename()，使用反引号‘`’包裹，允许R使用不规范的列名。...unlist()函数的作用，就是将list结构的数据，变成非list的数据，即将list数据变成字符串向量或者数字向量的形式。...R会把所有数据加载到内存中，数据库是从硬盘中获取数据的。...数据库与dplyr 必须使用src_*()函数创建一个数据源。#　使用data.table()处理数据是dplyr的替代，两个哪个好存在争议，最好学一个一直坚持下去。

1.9K2 0

R语言数据框、矩阵、列表的创建、修改、导出

data.frame生成指定数据框的列名及列的内容，如代码所示，此时列名不需添加""，df1为变量名，格式为列名=列的向量*matrix矩阵与向量一样只允许同一种数据类型，否则会被转换，可以理解为二维的向量...，列名被当作第一行，字符型与数值型在一起会将所有数值型改为字符型以满足向量同一类型ex1 <- read.table("ex1.txt",header = T);ex1 #header=F为默认，如果文件的第一行就是列名...函数可以避免此前的错误a<-fread("soft.txt",data.table = F)class(a)#但其不会有行名，且其会有一个data.table的数据结构多出来，可以设置data.table...)dim为维度，对数据框使用，输出(行数，列数)，nrow输出行数，ncol输出列数dim(df1)nrow(df1)ncol(df1)rowname输出行名，colname输出列名*注意没有"s"，善用...，输出结果是该向量的平均值加2倍的标准差，并写出用户使用该函数的代码。

7.8K0 0

R语言数据分析利器data.table包 —— 数据框结构处理精讲

会将非数字转化为字符 data.table数据框也可使用dplyr包的管道，这里不作阐述。...当使用dt_names = names(DT)的时候，修改dt_names会修改原data.table的列名，如果不想被修改，这个时候应copy原data.table，也可以使用dt_names <-...机器可读这个区域任何行号，默认1L,如果这行是空，就读下一行; skip跳过读取的行数，为1则从第二行开始读，设置了这个选项，就会自动忽略autostart选项，也可以是一个字符,skip="string...",那么会从包含该字符的行开始读； select,需要保留的列名或者列号，不要其它的； drop,需要取掉的列名或者列号，要其它的； colClasses，类字符矢量，用于罕见的覆盖而不是常规使用...，即x相当于DT$"x",当是FALSE时，列名仅仅作为字符串，可以用传统data.frame方法并且返回data.table，x[, cols, with=FALSE] 和x[, .SD, .SDcols

5.8K2 0

十、文件读写

语言与外部数据的沟通） 1.csv文件的读取方式： 1) excel读取 2) 读取为文本文件 3) sublime（适用于大文件） 4) R语言读取（表格文件读入到R语言里时，...更改方法：行名没有正确识别，修改用： row.names =1 列名改变了，修改时用：check.names =F ###为什么列名会被修改，因为在R语言中默认列名不能出现特殊字符...，如果有特殊字符，就会转变成.号， check.names =F 意思是不要检查和修改列名中的特殊字符。...###小技巧：图片 # data.table 读取任何形式的文件，包括问题文件 soft = data.table::fread("soft.txt",data.table = F) #正常文件...但是y中有字符型向量，有数值型向量，所以本身文件有问题，平时自己处理文件的时候直接输出为数据框、列表都可以。不保存为矩阵。

1.8K4 0

R语言学习笔记之——数据处理神器data.table

使用fread函数导入之后便会自动转化为data.table对象，这是data.table所特有的高性能数据对象，同时继承了data.frame传统数据框类，也意味着他能囊括很多数据框的方法和函数调用。...data.table列索引列索引与数据框相比操作体验差异比较大，data.table的列索引摒弃了data.frame时代的向量化参数，而使用list参数进行列索引。...(carrier,tailnum)] #但心里要清楚列索引接受的条件是含有列表的列表，而且这里的列表作为变量给出，而非data.frame时代的字符串向量。行列同时索引毫无压力。...注意以上新建列时，如果只有一列，列名比较自由，写成字符串或者变量都可以，但是新建多列，必须严格按照左侧列名为字符串向量，右侧为列表的模式，当然你也可以使用第二种写法。...当整列和聚合的单值同时输出时，可以支持自动补齐操作。当聚合函数与data.table中的分组参数一起使用时，data.table的真正威力才逐渐显露。 mydata[,.

3.6K8 0

R语言基因组数据分析可能会用到的data.table函数整理

因此，在对大数据处理上，使用data.table无疑具有极高的效率。这里主要介绍在基因组数据分析中可能会用到的函数。...fread 做基因组数据分析时，常常需要读入处理大文件，这个时候我们就可以舍弃read.table，read.csv等，使用读入速度快的fread函数 fread(input, sep=...设置了这个选项，就会自动忽略autostart选项，也可以是一个字符,skip="string",那么会从包含该字符的行开始读； select 需要保留的列名或者列号，不要其它的； drop...需要取掉的列名或者列号，要其它的； colClasses 类字符矢量，用于罕见的覆盖而不是常规使用，只会使一列变为更高的类型，不能降低类型； integer64 读如64位的整型数;...也有不同之处，一是use.names参数，可以指定是否使用相同列名bind，二是rbindlist可以使用在不知道对象名字的情况下，比如lapply(fileNames, fread) 。

3.4K1 0

从零开始的异世界生信学习 R语言部分 04 文件的读写与认知

，并且内容中的数值变为了字符串 ex1 <- read.table("ex1.txt",header = T) #通常读取txt格式文件，header参数表示将文件的第一行作为列名，默认为F 图片图片...read.table("soft.txt",header = T,sep = "\t") #调整数据的分隔符 soft2_2 <- read.delim("soft.txt",header = T) #可以使用...read.csv("xerror.csv") load("xerror.csv") 图片将一个项目的不同结果数据存在不同的文件夹图片将一个项目的不同部分分别存在不同的文件夹图片图片图片 # data.table...包中的fread函数 soft = data.table::fread("soft.txt",data.table = F) #读取速度更快，参数较少，可以直接读取问题文件 # rio包，包括import...由向量拼接而来 m3 = cbind(1:10, # cbind函数表示按照行合并向量，rbind为按照列合并数据 11:20, 30:21) m3 #4.

1.3K4 0

「R」数据操作（三）：高效的data.table

构建子集时，能够自动根据语义计算表达式，因此可以直接使用列名，像with()和subset()那样。...索引支持是data.table另一个独特功能，即我们可以创建键（key），使用键获取记录及其高效。...setkeyv()来设置键，但它只接受字符向量： setkeyv(product_stats, "id") 当key是一个动态变化的向量时，这个函数会非常好用。...(year = year(date))] } 这里我们使用.SD[[x]]提取x列的值，这跟通过名字从列表中提取成分或元素相同。...，而是使用market_data[, (columns) := list(...)]来动态设定列，其中columns是一个包含列名的字符向量，list(...)是每个列对应的值： price_cols

6.2K2 0

手把手教你用R语言读取CSV文件

本书主要是从网页读取文件。...如前面所述，第一个参数是文件名（或字符型变量）。注意我们如何显式地使用参数名file、head和sep。函数的参数能够按位置顺序赋值，而不用显式指定参数名，但指定参数名是最佳实践。...再次创建“Sport”列。...02 fread函数另一个读取大量数据的函数是data.table包的fread函数。第一个参数是读取的文件路径或者URL。header参数表示文件的第一行是列名，sep指定分隔符。...read_delim或者fread函数读取文件都非常快，具体使用哪个函数取决于dplyr或者data.table包中哪个更适合数据处理。关于作者：贾里德 P. 兰德（Jared P.

22K2 1

如何用R进行中文分词？

2）安装data.table。data.table是当前R中最强大的数据处理包之一，在大猫课堂中，所有的数据处理都要使用到data.table。...of worker > mixseg["华山海拔不到3000米"] [1] "华山" "海拔" "不到" "3000" "米" 虽然已经能对单句进行分词，但分词的结果是一个多维（每个词都是一维）的字符向量...我们希望最终的结果是一个字符，其中每个词都用空格分割，就像这样： [1] "华山海拔不到 3000 米" 如何做到这点呢？另外，如何在数据集中批量对文本分词？Let's move on!...代码如下（2行）： x.out <- sapply(dt$text, seg_x, USE.NAMES = F) dt[, text.seg := x.out] 其中sapply的作用是，对于字符向量...text中的每个元素都应用seg_x函数进行分词，然后把结果拼成一个长字符向量，其元素个数和text一致。

1.3K1 0

Day4-5 R语言代码

（2）在数据框类型数据的行取子集时、导入TXT文件时，注意一下数值型数据的行/中，有没有藏着字符型数据。马虎了就会影响后续数据处理。...2、读取各种类型文件（1）TXT文件，建议使用read.delim()函数，因为它的一些默认参数比read.table()适用范围更广；（2）csv文件 1）“check.names = F”...可以让R不修改行列名字，PS：R语言中行列名字中不能有特殊字符； 2）row.names = 1”这个参数意思时不能把第一列作为行名；PS：R语言中行名不能重复，如果将有重复的A列设为行名，需要先不将...3）一定要要经常查看自己的数据是否读取正确；（3）xlsx文件，建议使用rio包里面的函数 library(rio) #读取 ex1 = import("ex1.txt") #读取多工作簿的excel..."格式，需要添加参数"data.table=F"来避免 #data.table ex1 = data.table::fread("ex1.txt") class(ex1) ex1 = data.table

2432 0

Learn R 函数和R包

= iris[,5]) > plot(iris[,3],col = iris[,5]) > plot(iris[,4],col = iris[,5]) #当一个代码需要复制粘贴三次，就应该写成函数或使用循环...，输出结果是该向量的平均值加2倍的标准差，并写出用户使用该函数的代码。...Bioconductor 网站 >BiocManager::install( ) #### 3) github >devtools::install_github( ) #需要把用户名也写上 #如果不知道包从哪里来...save() #保存 save只能用于保存Rdata >save(test,file="xxx.Rdata") >load() #加载 >load("xxx.Rdata") #不需要进行赋值如x...[, 1]) : argument is not numeric or logical: returning NA > y[,1] GSM1 GSM2 GSM3 GSM4 GSM5 GSM6 #都是字符型向量

1.4K0 0

分析GSEA通路中的上下调基因

传统KEGG（通路富集分析）和GO（功能富集）分析时，如果富集到的同一通路下，既有上调差异基因，也有下调差异基因，那么这条通路总体的表现形式究竟是怎样？是被抑制还是激活？...GSEA分是根据处理后的差异倍数值对基因进行从大到小排序, 用来表示基因在两组间的表达量变化趋势。排序之后的基因列表其顶部可看做是上调的差异基因，其底部是下调的差异基因。...) tmp= fread(fs[1],data.table = F) View(tmp) gid=fread(fs[1],data.table = F)[,1] head(gid) rawcount =...) ****将新列名作为字符向量传递 colnames(rawcount) <- c("KD-1", "KD-2", "KD-3","control-1","control-2","control-3...") rownames(rawcount)<- tmp$Geneid View(rawcount) ****基因ID转换 #由于本次使用的为gencode或ensembl的gtf与cdna文件，因此最后得到的为

1.3K3 0

生信技能树 R语言入门第一周总结

其中用于生信分析最重要的两种数据结构是向量和数据框，需要重点掌握。向量的创建方式：以函数c为基本方式，纯数值型向量可通过n:m创建。创建字符型向量只能用c。...一个向量中只能有一种数据类型，优先级为：character>numeric>logical。多个类型的数据类型存在时，向量会自动定义为优先级最高的数据类型。...；check.names表示保留‘-’符号；soft2 <- read.table("soft.txt",header = T,sep = "\t")header=T表示使用第一行为列名，sep = "...一些最基本的函数代替手动看/数数的方法：1、使用length和table函数；2、使用ncol和nrow，如取数据框b的最后一列：b[,ncol(b)]，删除b的最后一列：b[,-ncol(b)]3、最容易会犯的错误...忘记c就是忘记创建向量直接写了元素；忘记引号就是把要写的字符直接打成了变量，而变量本身不存在，所以经常会报错；忘记逗号主要是在数据框取某些行或列，只写了行或列的条件，没写逗号表示出行或列，另外就是在创建数据框的不同列时忘记用逗号分隔

1.1K9 0

Jelys Note之生信入门class5

R包如何使用（1）---获取帮助查看帮助文档：？...[] · 两个中括号前取子集一般是从列表中提取！[[]] · 而文件名称应该：1.在实际参数位置2.且在能识别文件名称的函数括号内3.带引号 5....让代码可重复，数据可重现不要使用excel会改基因名称！...列名没有被正确识别！如header=F 解决办法：！看函数帮助文档！ read.table(file,header=F---表格中的第一行是否是列名！)...用于读取/导出文件的R包 fread（）实现智能读取【data.table】 export（）导出【rio】 import_list---多个工作部的数据，引入

8991 0

「R」data.table 包功能特性学习

语法格式： DT[i, j, by] 释义为对data.table对象DT，使用i选择行，然后按照by计算j。...如果你还没有安装该包，运行： install.packages("data.table") 导入包 library(data.table) 创建一个data.table set.seed(45L)...1 A -0.380 7 ## 6: 1 C 0.341 9 ## 7: 2 A -0.703 10 ## 8: 2 C -0.746 12 对j列进行操作 # 返回第二列为一个向量...## 8: B -0.746 ## 9: C 0.341 ## 10: A -0.703 ## 11: B -0.380 ## 12: C -0.746 # 返回V1列所有元素和为一个向量...(sum(V1), sd(V3))] ## V1 V2 ## 1: 18 0.455 # 跟上面一样，但生成新的列名 DT[, .

1.9K1 0

表达芯片数据分析2

::fread("GPL570-55999.txt",data.table=F, skip=17) colnames(b) #下一行代码里的列名是从colnames(b)...str_detect(ids2$symbol,"///");table(k2) ids2 = ids2[ k1 & k2,] # ids = ids2 #使用方法二需要将42行F改为T，55行取消注释...', getGPL = F)#网速太慢，下不下来怎么办#1.从网页上下载/发链接让别人帮忙下，放在工作目录里#2.试试geoChina,只能下载2019年前的表达芯片数据class(eSet)length...()) load(file = "step1output.Rdata")# 1.Group----library(stringr)# 标准流程代码是二分组，多分组数据的分析后面另讲# 生成Group向量的三种常规方法...}else if(F){ # 第二种方法，眼睛数，自己生成 Group = rep(c("Disease","Normal"),each = 10)}else if(T){ # 第三种方法，使用字符串处理的函数获取分组

3182 0

R练习50题 - 第二期

习题预览今天我们继续做题，由于整个题目按照从易到难排列，所以今天的题目并不会很难。先看一下预览：每天每个交易所上涨、下跌的股票各有多少？沪深300成分股中，每天上涨、下跌的股票各有多少？...由于股票代码symbol的最后两个字符表示交易所（例如，600123.SH表示上海交易所，股票代码600123），我们在建立分组变量时需要使用str_sub函数截取最后两个字符。代码及解析： ?...在keyby语句中，我们创建了三个分组变量，首先是日期date，其次是交易所exchange（只取SH/SZ两个值），最后是涨跌updown。注意这三个变量的先后顺序非常重要，不能颠倒。...index_w300是一个数值变量，与零进行比较运算后会生成一列与原向量等长的布尔向量（例如 c(True, False False, True...)）。...注意以上运算的结果是一个取值为True或False的向量，data.table最终会挑选出为True的那些行。我们仍旧使用ifelse函数生成updown这个变量。

8812 0

MR应知应会：MungeSumstats包

该软件包还使用户能够灵活地将重新格式化的文件导出为制表符分隔的 VCF 或 R 本机对象，例如 data.table、GRanges 或 VRanges 对象。...force_new_z 当“Z”列已经存在时，默认使用它。要从 P 设置为 TRUE 覆盖并计算新的 Z 分数列。 compute_n 是否插补 N。...rmv_chr向量或字符应删除 SNP 的染色体。如果不需要过滤，则使用 NULL。默认为 X、Y 和线粒体。...任何不在参考基因组上的 SNP 将使用染色体和碱基对位置数据从参考基因组（如果可能）进行校正。...对于翻转值，这表示等位基因是否根据 MungeSumstats 从输入列标题中选择的 A1、A2 进行切换，因此可能与创建者的意图不符。请注意，这些列将出现在返回的格式化摘要统计信息中。

2.1K1 1

【技巧】如何快速按照日期分组

然而这种做法特别麻烦，因为我们常常要尝试多种不同的分类长度，很难事先就一次性创建好用于分类的变量。...本期大猫将教大家使用 data.table包的 keyby语句完成上述任务。...使用 data.table的好处是：不需要事先创建分类变量，啥时想分类了，直接分就可以（group on the fly）速度特别、特别快！代码非常、非常简洁！（也就十几个字符！）...实战操作生成样例数据集首先我们生成一个样例数据集： # 生成 100 个日期，从2018-01-01开始 set.seed(42) n <- 100 dt <- data.table(date =...按照“是否为周三”进行分类如果我们想把样本分成两组，一组是周三（True），一组是非周三（False），则只要使用 wday(date)==3来生成一列值为 True或者 False的向量就行。

2.5K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云