开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

使用function在data.table中创建可变数量的列

在data.table中使用function创建可变数量的列，可以通过使用:=操作符和lapply函数来实现。下面是一个完善且全面的答案：

在data.table中，可以使用:=操作符将一个函数应用于数据表的每一行，并将结果赋值给新的列。为了创建可变数量的列，可以使用lapply函数来遍历一个包含函数的列表，并将每个函数应用于数据表的每一行。

以下是一个示例代码：

library(data.table)

# 创建一个包含函数的列表
functions <- list(
  col1 = function(x) x + 1,
  col2 = function(x) x * 2,
  col3 = function(x) x^2
)

# 创建一个包含数据的data.table
dt <- data.table(x = 1:5)

# 使用lapply和:=操作符创建可变数量的列
dt[, names(functions) := lapply(functions, function(f) f(x))]

# 输出结果
print(dt)

在上面的示例中，我们首先创建了一个包含三个函数的列表functions，每个函数都会对输入的值进行不同的操作。然后，我们创建了一个包含一列数据的data.table dt。接下来，我们使用lapply函数和:=操作符将functions列表中的每个函数应用于dt的每一行，并将结果赋值给新的列。最后，我们打印出结果。

这个方法的优势是可以灵活地创建可变数量的列，根据实际需求进行扩展和修改。它适用于需要根据不同的函数对数据进行处理，并将结果保存在新的列中的场景。

推荐的腾讯云相关产品是TencentDB，它是腾讯云提供的一种高性能、可扩展的云数据库解决方案。TencentDB支持多种数据库引擎，包括MySQL、SQL Server、PostgreSQL等，可以满足不同应用场景的需求。您可以通过以下链接了解更多关于TencentDB的信息：TencentDB产品介绍

请注意，本答案没有提及亚马逊AWS、Azure、阿里云、华为云、天翼云、GoDaddy、Namecheap、Google等流行的云计算品牌商，以符合要求。

相关搜索:Dplyr使用可变数量的列输出进行变异使用data.table，不创建新列的条件计算使用function基于另一列的值创建Pandas列使用Pig为HBase中的列族添加可变数量的列使用r中的data.table创建具有不同规则的列使用可变数量的XML标记通过Zeep创建SOAP请求在API网关资源中创建数量可变的方法和资源在data.table中的列中返回列表在Java中链接可变数量的承诺(CompletableFuture)在Julia中连接数量可变的数组

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Power BI: 使用计算列创建关系中的循环依赖问题

文章背景：在表缺少主键无法直接创建关系，或者需要借助复杂的计算才能创建主键的情况下，可以利用计算列来设置关系。在基于计算列创建关系时，循环依赖经常发生。...当试图在新创建的PriceRangeKey列的基础上建立PriceRanges表和Sales表之间的关系时，将由于循环依赖关系而导致错误。...在这个例子中，修复方法很简单：使用DISTINCT代替VALUES。一旦改用DISTINCT，就可以正常创建关系了。结果如下图所示。正确设置关系后，可以按价格区间切片了。...在我们的例子中，情况是这样的： Sales[PriceRangeKey]依赖PriceRanges表，既因为公式中引用了PriceRanges表（引用依赖），又因为使用了VALUES函数，可能会返回额外的空行...由于两个依赖关系没有形成闭环，所以循环依赖消失了，可以创建关系。 3 避免空行依赖创建可能用于设置关系的计算列时，都需要注意以下细节：使用DISTINCT 代替VALUES。

6152 0

在springboot工程中修改使用quartz创建的定时任务

Quratz是什么:Quartz 是一个完全由 Java 编写的开源作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。...Quartz 实现了作业和触发器的多对多的关系，还能把多个作业与不同的触发器关联。创建springboot工程集成Quratz：在IDEA中基于springboot 2.7....*创建工程，集成Quratz，勾选I/O下Quratz Scheduler即可；图片创建完成后的pom.xml中Quratz的依赖是 org.springframework.boot....build(); scheduler.rescheduleJob(triggerKey,trigger); return "ok"; }实现逻辑：在以上代码中...，接口服务中的Scheduler是可以直接依赖注入的；不需要额外指定Bean；但在之前版本的Quratz中是需要的；获取所有job的逻辑是：使用GroupMatcher匹配获取所有的jobKey；主要使用

1.6K3 0

如何使用Phoenix在CDH的HBase中创建二级索引

3.Covered Indexes(覆盖索引) ---- 1.使用覆盖索引获取数据的过程中，内部不需要再去HBase的原表获取数据，查询需要返回的列都会被存储在索引中。...之外的列，则可以确保该查询使用Index，关键字INCLUDE包含需要返回数据结果的列。...3.在查询项中不包含索引字段的条件下，一样查询比较快速。...因为s2并没有包含在索引中。所以使用全局索引，必须要所有的列都包含在索引中。那么怎样才能使用索引呢？有三种方法。...3.创建本地索引 create local index index2_hbase_test on hbase_test (s7); （可左右滑动）本地索引和全局索引不同的是，查询语句中，即使所有的列都不在索引定义中

7.4K3 0

「R」数据操作（三）：高效的data.table

N是最常用的符号之一，它表示当前分组中，对象的数目（就不用调用nrow函数啦）。在[]使用它指提取最后一行。...data.table中，by所对应的组合中的值是唯一的，虽然实现了目标，但结果中没有设置键： key(type_class_test0) #> NULL 这种情况下，我们可以使用keyby来确保结果的data.table...的动态作用域我们不仅可以直接使用列，也可以提前定义注入.N、.I和.SD来指代数据中的重要部分。...为演示，我们先创建新的data.table，命名为market_data，其中date列是连续的。...举例，我们定义一个函数，计算market_data中由用户定义的列的年度均值： average = function(column){ market_data[, .

6K2 0

如何对动态创建控件进行验证以及在Ajax环境中的使用

首先给一个常规的动态创建控件，并进行验证的代码 [前端aspx代码] <%@ Page Language="C#" AutoEventWireup="true" CodeFile="Test.aspx.cs...Cell = new TableCell(); Cell.Controls.Add(_TxtBox); Cell.Controls.Add(_Require);//将刚才<em>创建</em><em>的</em>二个控件...runat="server" Text="验证动态控件" Enabled="true" /> 再次运行，发现没办法再对动态生成的控件进行验证了...(也就是说，新创建的验证控件没起作用) ,怎么办呢？...经过一番尝试，发现了一个很有趣的解决办法，具体参看以下代码: <%@ Page Language="C#" AutoEventWireup="true" CodeFile="Test.aspx.cs"

7.7K5 0

executeupdate mysql_使用Mysql中的executeUpdate在SQL语句中创建表

catch (SQLException e) { // TODO Auto-generated catch block e.printStackTrace(); } } executeUpdate创建...DB并使用他的前两个方法工作正常。...如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

5.5K2 0

5个例子比较Python Pandas 和R data.table

data.table) melb <- fread("datasets/melb_data.csv") 示例1 第一个示例是关于基于数据集中的现有列创建新列。...另一方面，data.table仅使用列名就足够了。示例3 在数据分析中使用的一个非常常见的函数是groupby函数。它允许基于一些数值度量比较分类变量中的不同值。...我们求出了房屋的平均价格，但不知道每个地区的房屋数量。这两个库都允许在一个操作中应用多个聚合。我们还可以按升序或降序对结果进行排序。...我们使用计数函数来获得每组房屋的数量。”。N”可作为data.table中的count函数。默认情况下，这两个库都按升序对结果排序。排序规则在pandas中的ascending参数控制。...data.table中使用减号获得降序结果。示例5 在最后一个示例中，我们将看到如何更改列名。例如，我们可以更改类型和距离列的名称。

3K3 0

R数据框如何取交集

你可以在查询miRNA靶基因的时候限定使用哪些预测软件（如下图红圈所示），这样得到的结果就是多个预测软件预测结果的交集。...miRNA预测结果都是两列的数据框。...我们首先来创建两个数据框，模拟一下不同的软件的预测结果 set.seed(123) df1=data.frame(mir=sample(LETTERS,26),target=c(rep("TP53",...下面给大家介绍三种对R数据框取交集的方法方法一、我们将各列的信息合并成一个字符串，然后取交集 #将各列的信息用_连接起来 combine1=apply(df1,1,function(x) paste...all_equal(result1,result2) #[1] TRUE 方法三、利用data.table包里的fintersect函数 #加载data.table包 library(data.table

1.6K2 0

「r」dplyr 里的 join 与 base 里的 merge 存在差异

今天在使用连接操作时发现：虽然都是合并操作函数，dplyr 包里的 *_join() 和基础包里面的 merge() 存在差异，不同的数据结构，结果也会存在偏差。...相同的数据，不同的操作函数存在差异在进行连接操作时，我们会发现 dplyr 的结果会报错！...本质上是 data.table 体格的泛型函数不支持类似基础包中的操作。如何编写代码支持对上述数据集的连接操作？...如果 be_join 不为空，进行如下的循环：如果存在，则将这个子集和 to_join 按共同列合并如果不存在，使用循环位移一位，将当前 be_join 的第 2 个子集移动为第 1 个。...merge() 函数在进行连接操作时会输出有问题的结果，所以建议使用的小伙伴仔细检查结果。

1.5K3 0

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

可以看到，计算结果中的第一列实际上是“SELLERID.CLIENT”，我们需要把它拆分成两列并调换顺序才行。...")],function(x) sum(x)) 4、subset()函数利用subset()函数进行访问和选取数据框的数据更为灵活，subset函数将满足条件的向量、矩阵和数据框按子集的方式返回。...(iris$setosa)] #按照照setosa的大小，重排Sepal.Length数据列四、dplyr与data.table data.table可是比dplyr以及python中的...data.table包的语法简洁，并且只需一行代码就可以完成很多事情。进一步地，data.table在某些情况下执行效率更高。...在使用data.table时候，需要预先布置一下环境： data<-data.table(data) 如果不布置环境，很多内容用不了。

20.6K3 2

RNA-seq入门实战（三）：在R里面整理表达量counts矩阵

table(duplicated(symbol)) #统计重复基因名 ###使用aggregate根据symbol列中的相同基因进行合并 counts <- aggregate(counts...aggregat 将symbol列中的相同基因进行合并 tpm <- column_to_rownames(tpm,'Group.1') id转换前 id转换后 4....在这里展示筛选出至少在重复样本数量内的表达量counts大于1的行（基因），可以看到超过一半以上的基因都被筛掉了。...筛选出至少在重复样本数量内的表达量counts大于1的行（基因） keep_feature 1) >= 2 table(keep_feature) #查看筛选情况，...data.frame(row.names=colnames(counts), group_list=group_list) #### 初步过滤低表达基因 #### #筛选出至少在重复样本数量内的表达量

15.8K4 5

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

data.table中，还有一个比较特立独行的函数：使用:=引用来添加或更新一列（参考：R语言data.table速查手册） DT[, c("V1","V2") := list(round(exp(V1...—————————————————————— 实战一：在data.table如何选中列，如何循环提取、操作data.table中的列？...除了行，就是列的问题了。在data.table操作列，真的是费劲。。。常规来看， data[，....(x)] 还有 data$x 如果有很多名字很长的指标，data.table中如果按列进行遍历呢？ data[,1]是不行的，选中列的方式是用列名。...2016-11-28补充：留言区大神给了一个比较好的选中列的方式，其中主要就是对with的使用： data.table取列时，可以用data[,1,with=FALSE]取data的第一列

7.7K4 3

R语言入门之数据的导入和导出

第一部分导入数据（Importing Data）在我们平时的研究工作中，经常使用的是逗号分隔文件（.csv文件）、制表符分隔文件（.tsv文件）和空格分隔文件（.txt文件）。...直接高效读取以.gz结尾的压缩文件一般在R中可以使用gzfile()的方式读取压缩文件，但如果使用data.table包里的fread()函数则可以大大提高工作效率。...Exporting Data）在R语言中有很多方法可以导出各种类型的数据，但常用的文件格式也就第一部分中主要涉及的三类，即逗号分割文件、制表符分隔文件以及空格分隔文件。...导出数据为txt文件 write.table(mydata, "c:/mydata.txt") Tips：（1）使用?function()的形式查阅函数的帮助信息，比如?...function()的方法（2）推荐刚入门的小伙伴下载Rstudio，使用起来很方便（3）data.table这个包的一些功能可能依赖其它包，需要将其依赖包也安装上

3.2K4 0

用data.table语句批量处理变量

村长继续为大家奉上data.table使用案例心得，希望大家能够继续支持村长！！...问题：批量处理表中变量正式开始说问题之前，我们先回顾一下data.table的基本语句DT[i, j, by]，简而言之，"i"是对行进行选择，"j"是对列进行操作，"by"是分组。...批量处理法：用lapply批量处理变量在此时lapply的妙用就显现出来了，在R中lapply用来对list中每一个element进行相同处理，如何把它运用到data.table，话不多说先上代码：...我们知道在data.table包中，.SD是经过i和by处理之后剩下的那部分数据集，它的格式是一个data.table，同时它是一个list。...而我们要处理的变量是第3个到第34个，所以在.SD中选出3至34列，运用lapply对选中的.SD[, 3:34]里面每一个element使用as.Date函数。再看，':='的左边。

1.1K3 0

R语言与python对数据框的操作(对比笔记)

1. data.table VS pandas 这里使用R语言的data.tablet包和python的pandas进行对比....使用R语言, 通过data.table创建数据框. library(data.table) set.seed(123) DT <- data.table(V1=c(1,2),V2=c("A","B","...或者使用list(), 等同于.() DT[,list(V2)] ? 2.2 行列筛选选择V2等于A的列 DT[V2=="A"] ? 也可以使用下面这种形式 DT[V2=="A",] ?...3.2 pandas选择列 df["V2"] ? 也可以使用列数，使用iloc df.iloc[:,1:2] ?...创建新列V5 df.V5 = df.V3*df.V4 df ?

2.9K2 0

获取基因有效长度的N种方法

featureCounts和Salmon了，在这两类软件的输出结果中，除了基因（或转录本）的counts信息外，也包含了基因有效长度信息，如featureCounts输出文件的Length这一列对应的就是基因有效长度...之前一直以为featureCounts的Length只是单纯的基因长度，后来经过多种方法比较后发现其实Length这一列就已经是基因的有效长度了...在文章后面我也会展示这几种方法比较的结果）因此，最方便的做法就是在下游获取...) #可多核读取文件 a1 <- fread('counts.txt', header = T, data.table = F)#载入counts，第一列设置为列名 ### counts矩阵的构建...官方更推荐使用EffectiveLength进行后续的分析，它结果中的TPM值也是根据EffectiveLength计算的。...Salmon官方更推荐使用EffectiveLength进行后续的分析，认为其能更好消除测序时基因长度的影响，它结果中的TPM值也是根据EffectiveLength计算的，后续分析中可以直接采用。

4.5K1 1

R语言数据分析利器data.table包 —— 数据框结构处理精讲

因此，在对大数据处理上，使用data.table无疑具有极高的效率。这里我们主要讲的是它对数据框结构的快捷处理。...当使用dt_names = names(DT)的时候，修改dt_names会修改原data.table的列名，如果不想被修改，这个时候应copy原data.table，也可以使用dt_names <-...比如此例取出DT 中 X 列为"a"的行，和"a"进行merge。on参数的第一列必须是DT的第一列 DT[....(sv=sum(v))] #对y列求和，输出sv列，列中的内容就是sum(v) DT[, ...., by=x][order(x)] #和上面一样，采取data.table的链接符合表达式 DT[v>1, sum(y), by=v] #对v列进行分组后,取各组中v>1的行出来，各组分别对定义的行中的

5.6K2 0

懒癌必备-dplyr和data.table让你的数据分析事半功倍

mutate( ) 为数据增加新列 mutate(df,vnew1=v1-v2,vnew2=vnew1+v3) 与基础包里的transform()函数接近，但mutate可以使用你刚刚创建的column...找到合适的packages并学习使用它，绝对会让我们数据分析工作事半功倍！我们有没有发现dylyr包中函数使用的一些规律？有的！...data.table包 dplyr已经可以满足我们数据分析工作中大部分的需求，后来该包的作者又开发了一个炫酷吊炸天的包“data.table” 如果你的日常处理数据在几万到十几万行，那么用dplyr..."B")] 使用j DT[,v1] #选择v1列那如果我要选择多列呢，大家注意一下这里不是用c()来选取了，而是通过.()来选取，注意前面有一个”.”号，所以我说data.table的语法有点奇怪呢...以上讲的这些只是我工作中data.table用得最多的功能，它的强大之处还远远不止这些！如果你想深入，可以去官网下载文档，你绝对值得拥有！

2.4K7 0

R练习50题 - 第一期

只可惜Renkun并没有提供答案，所以我们在这里提供我们的版本。我们的所有答案都将使用data.table这个包。我们认为data.table是最优秀的数据处理工具，没有之一。...unique：找出symbol中不重复的值。在data.table的语法中，先进行列选择操作，再对列进行处理。所以上述语句会先执行str_detect，再执行unique。...这是因为data.table的第一个语句用来对列进行选择，由于我们这里需要对所有列进行统计，所以不需要进行任何操作。 keyby用来进行分组，是整个代码的核心。先来看keyby = ....由于在keyby语句中我们已经按照日期与涨跌进行了分组，所以这一步我们只需要统计每个组有多少个股票就可以了。我们在这里使用了uniqueN这个函数。...它是data.table内置函数之一，和unique几乎执行相同的操作，唯一不同的是，unique返回的是不重复的item（是一个向量），而uniqueN返回的是不重复的数量（是一个数字）。

2.4K4 0

数据流编程教程：R语言与DataFrame

在实际使用中，data.talbe::fread()的读取速度可以比原生的read.csv有3-10倍的提升速度。...(): 按列变量选择 filter(): 按行名称分片 slice(): 按行索引分片 mutate(): 在原数据集最后一列追加一些数据集 summarise(): 每组聚合为一个小数量的汇总统计，通常结合...(x, y): 所有 x 在 y 中匹配的部分 anti_join(x, y): 所有 x 在 y 中不匹配的部分（3）集合操作 intersect(x, y): x 和 y 的交集（按行） union...(x, y): x 和 y 的并集（按行） setdiff(x, y): x 和 y 的补集（在x中不在y中）更多详细操作可以参考由SupStats翻译的数据再加工速查表，比Python的老鼠书直观很多...在R中使用DDF，我们不需要修改之前任何的代码，并且绕过Hadoop的绝对限制，就可以让data frame格式的数据，自动获得分布式处理的能力！

3.8K12 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭