R data.table对函数参数执行join

R data.table是一个用于数据操作和分析的强大工具包，它在处理大型数据集时表现出色。在data.table中，我们可以使用[ ]符号对数据进行子集选择、筛选和计算。而对函数参数执行join是data.table中常见的操作之一。

join操作是将两个或多个数据表按照某些共同的列进行连接的过程。它允许我们根据指定的连接条件将数据表中的数据按行合并，并根据需要添加新的列。

在data.table中，我们可以使用merge()函数进行join操作。该函数接受多个参数，包括x、y、by、on、all.x、all.y等。下面是对这些参数的解释：

x：指定要连接的第一个数据表。
y：指定要连接的第二个数据表。
by：指定连接条件，通常是两个表中具有相同名称的列。也可以通过by.x和by.y分别指定两个表中的列名。
on：指定连接条件，可以是一个字符向量，表示两个表中要匹配的列名。
all.x：逻辑值，表示是否保留第一个表中未匹配到的行，默认为FALSE。
all.y：逻辑值，表示是否保留第二个表中未匹配到的行，默认为FALSE。

通过使用merge()函数并提供适当的参数，我们可以在R data.table中执行不同类型的join操作，包括内连接（inner join）、左连接（left join）、右连接（right join）和全外连接（full outer join）等。

以下是一些示例，展示了如何使用R data.table对函数参数执行join操作：

library(data.table)

# 创建两个示例数据表
data1 <- data.table(ID = c(1, 2, 3),
                    Name = c("John", "Alice", "Bob"))

data2 <- data.table(ID = c(2, 3, 4),
                    Age = c(25, 30, 35))

# 使用merge函数进行内连接
result_inner <- merge(data1, data2, by = "ID")
print(result_inner)

# 使用merge函数进行左连接
result_left <- merge(data1, data2, by = "ID", all.x = TRUE)
print(result_left)

# 使用merge函数进行右连接
result_right <- merge(data1, data2, by = "ID", all.y = TRUE)
print(result_right)

# 使用merge函数进行全外连接
result_outer <- merge(data1, data2, by = "ID", all = TRUE)
print(result_outer)

在上面的示例中，我们创建了两个示例数据表data1和data2，然后使用merge()函数对它们进行了不同类型的join操作，并打印出了结果。

需要注意的是，R data.table还提供了更高效的join操作方法，如data.table函数中的on参数和data.table对象中的[ ]符号。这些方法在处理大型数据集时表现更好。

关于R data.table的更多详细信息，您可以访问腾讯云的产品介绍页面：R data.table产品介绍。

R data.table对函数参数执行join

、、、

我想加入两个DT，假设一个键作为函数参数传递。在函数之外，它运行得很好，如下所示： DT1 = data.table(i=1:12, z=runif(12), toto=rep(1:3, each=4), tata=rep(21:23, each=4)) DT3 <- DT1[DT2[cr

浏览 22提问于2021-01-18得票数 2

回答已采纳

3回答

为什么data.table::B[A]和plyr::join(A，B)返回不同的结果？

、、

我在R中有两个数据表B <- data.table(a = 2:3, b = 13:14)C<-plyr::join(setkey(A, "a")B[A] a b i.b2: 2 13 134: 4 NA 15 为什么我们对这两个函数的结果有差

浏览 2提问于2019-11-04得票数 2

回答已采纳

3回答

在data.table中使用‘on’对数据执行和写入函数

、

我在R中使用data.table，并尝试创建和执行一些函数，这些函数将对每个组进行一些计算(DT[i, j, by = ....])，但我需要在函数中的整个数据集上执行函数。例如，以虹膜数据为例，我可以做以下工作，以得到组和总体均值(“偏差”)之间的差异：dtIris <- data.table(iris) # Sample means- way“，以便使我的

浏览 4提问于2020-04-27得票数 0

1回答

将数据表联接运算符应用于数据表列表

、、

我很好奇是否可以将[或join函数应用到data.tables列表中。我可以让函数在列表的每个元素上工作，但是当使用lapply将函数应用到整个列表时，会收到一个错误。### Require data.tabledata <- data.table(id = lettersmean = 140, sd = 20), key = 'id&

浏览 3提问于2013-08-28得票数 1

回答已采纳

2回答

在SparkR中使用apply函数

我见过更老的(1.3版)示例，人们在DataFrames上使用apply函数，但看起来不再直接可用。示例：xDF_R = data.frame(x)xDF_S = createDataFrame(sqlContext,xDF_R)xDF_R$result = sapply(xDF_R$number, p

浏览 1提问于2015-10-23得票数 7

2回答

在“数据分析软件: R编程”(：Programming )一书中，约翰·钱伯斯强调，函数一般不应因其副作用而编写；相反，函数应该返回值而不修改其调用环境中的任何变量。相反，使用data.table对象编写好的脚本应该特别避免使用<-分配对象，后者通常用于存储函数的结果。首先是一个技术性的问题。假设一个名为proc1的R函数接受一个data.table对象x作为其参数(除了其他参数之外)。proc1返回NULL

浏览 3提问于2012-12-07得票数 42

回答已采纳

2回答

在分组的data.table上并行运行用户定义的for循环函数

、、、、

我在R中使用一个大约有6e6行的data.table，并创建了一个函数，我通过data.table传递该函数，以基于两个分组值创建一个新列。从技术上讲，我的函数遍历分组参数的每一行并执行一些非常简单的代数操作，但是考虑到我的data.table的大小，这将需要相当长的时间。我熟悉foreach()函数和其他使用多核进行计算的函数，但我还没有读过或遇到过一种使用并行化来加速在传递给data.t

浏览 15提问于2019-09-14得票数 0

2回答

将多个整数列读入字符串，尝试将gsub转换回整数。

、、、、

换句话说，1300是1,300，R认为它是一个字符。我尝试过使用lapply，但不确定将什么作为"x“变量。这是我的函数，下面有错误 as.integer(

浏览 1提问于2018-04-05得票数 0

回答已采纳

1回答

R中的非字符库调用中有哪些类？

在R中，我们可以用以下内容装载包：或在?library中，它说这个参数可以是一个字符或一个名称。is.name(knitr)class(knitr)更复杂的是，当包包含一个函数时，该函数也是包的名称：clas

浏览 2提问于2016-07-27得票数 4

回答已采纳

2回答

在函数中加入data.tables

、

我希望通过在函数中执行联接来更改data.table。我理解data.tables是通过引用的方式工作的，因此假定将一个data.table的联合版本重新分配到它本身将改变原始的data.table。library('data.table') join_test <- function(DT) { test_dt= da

浏览 1提问于2016-10-07得票数 1

回答已采纳

2回答

如何在考虑数据帧顺序的情况下匹配R中两个列表的元素

大家好，我正在处理R中的两个数据帧列表。我想解决一个小问题，我在每个列表中都有相同数量的数据帧，并且每个数据帧都在相同的位置。$a2 005 12 D009 16 F a1 b1 c1012 3 H我正在尝试构建一个函数来进行匹配如果我可以有一个函数，我会使用plyr中的llply函数来创建新的列表，但我找不到解决方案。谢谢。

浏览 0提问于2013-11-21得票数 3

1回答

对计算值进行合并

、、

考虑以下数据集：right <- data.table(c = c(1, 4), d =输出将如下所示： joined <- data.table(a = 1:3, b = c("foo", "bar", "bar"), d = c("foo", "bar&quo

浏览 2提问于2020-03-02得票数 0

4回答

合并表:根据连接行的方式对输出进行分类

、

在R中加入(大的、复杂的)表时，我通常很难正确地检查这个操作的结果。参见这里一个最小的可重现性示例：table1 <- data.table(id=c("A", "B", "C"), price=c(12,11,10)) table2<- data.table(id=c("A", "C", "C", "D"), wharehous

浏览 6提问于2019-03-05得票数 2

回答已采纳

3回答

使用R中的data.table将列限制在特定范围内

、

我在R中使用data.table包，并希望对列执行操作。具体来说，我希望强制所有的值都是(0，1)。让我们在这里使用一个简单的例子：我的数据被存储为一个data.table，所以我想我可以这样做：但聚合函数(min和max)计算向量min/max。使用data.table完成这类任务的正确方法是什么？

浏览 1提问于2016-01-28得票数 1

回答已采纳

1回答

如何从函数参数定义R data.table/data.framework列？

、、、、

我在一个R包中创建了一个函数，它包含几个参数。其中一个参数是R data.table的列名。dt[, column_name:=42]df$column_name = 42func(dt, col=

浏览 0提问于2018-05-29得票数 2

回答已采纳

1回答

在R data.table中，当args作为命名列表传递时，对多个列进行整形失败

、

在R data.table中，可以通过传递列名列表(value.var=)和聚合函数列表(fun.aggregate=)对多个列进行整形。当这些列表被显式地传递给函数参数时，这种方法效果很好。(letters[1:2], 20,TRUE), d1 = runif(20), d2=1L)dcast(dt, x + y ~ z, fun=list(sum, mean), value.var=list(

浏览 0提问于2018-06-22得票数 3

1回答

在R中不与data.table一起工作

、、、

我正在使用R包data.table处理大数据文件。然而，我发现它不能与opencpu一起使用。例如，我的R函数是， library(data.table) o = iris[,.N,Species] } var req = ocpu.call(&qu

浏览 3提问于2016-11-05得票数 1

3回答

列出脚本中所需的所有包，假设R中有package::function()

、、

让我们假设脚本中的所有非基R函数都由package::function()调用。因此，在脚本运行期间，它不会加载任何完整的包。让我们假设我们有一个名为run.R的R脚本，它包含以下内容。"data.table::fread(file)"install.packages("<

浏览 0提问于2020-01-14得票数 1

1回答

如何在R中引用函数中的本地环境？

、

[这个问题已经在中得到了解决，但我将其发布出来是为了将来对其他人有所帮助。] return(tmpWeb)但是，对myFunc()的调用似乎并不表示localFunc调用了data.table()。(注意：where参数指定搜索路径。) 更新1:正如Tommy和Spacedman所指出的，诀窍在于指定environment()。对foodweb()的调

浏览 0提问于2012-01-08得票数 35

回答已采纳

4回答

是否有使用列中的定性需求对数据进行子集的功能？

、

给定主要数据帧，我尝试：但是，R返回“选定的未定义列”

浏览 0提问于2020-03-11得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R data.table对函数参数执行join

相关·内容

R data.table对函数参数执行join

为什么data.table::B[A]和plyr::join(A，B)返回不同的结果？

在data.table中使用‘on’对数据执行和写入函数

将数据表联接运算符应用于数据表列表

在SparkR中使用apply函数

data.table对象的书写函数(过程)

在分组的data.table上并行运行用户定义的for循环函数

将多个整数列读入字符串，尝试将gsub转换回整数。

R中的非字符库调用中有哪些类？

在函数中加入data.tables

如何在考虑数据帧顺序的情况下匹配R中两个列表的元素

对计算值进行合并

合并表:根据连接行的方式对输出进行分类

使用R中的data.table将列限制在特定范围内

如何从函数参数定义R data.table/data.framework列？

在R data.table中，当args作为命名列表传递时，对多个列进行整形失败

在R中不与data.table一起工作

列出脚本中所需的所有包，假设R中有package::function()

如何在R中引用函数中的本地环境？

是否有使用列中的定性需求对数据进行子集的功能？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐