首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >dplyr::copy_to和sparklyr::sdf_copy_to有什么区别?

dplyr::copy_to和sparklyr::sdf_copy_to有什么区别?
EN

Stack Overflow用户
提问于 2019-05-15 19:57:55
回答 1查看 853关注 0票数 5

我正在使用sparklyr库与“spark”进行交互。存在用于将数据帧放入spark上下文中的函数。这样的函数是'dplyr::copy_to‘和'sparklyr::sdf_copy_to’。有什么不同?什么时候建议使用一种而不是另一种?

EN

回答 1

Stack Overflow用户

发布于 2020-10-19 23:24:21

它们是一样的。我会使用copy_to而不是专业的sdf_copy_to,因为它与其他数据源更一致,但这是风格问题。

函数copy_to是来自dplyr的通用函数,可用于任何实现dplyr后端的数据源。

您可以将其与spark连接一起使用,因为sparklyr实现了copy_to.src_sparkcopy_to.spark_connection。它们不会向用户公开,因为您应该使用copy_to并将其分派给正确的方法。

copy_to.src_sparck只是调用copy_to.spark_connection

代码语言:javascript
运行
复制
#> sparklyr:::copy_to.src_spark
function (dest, df, name, overwrite, ...) 
{
    copy_to(spark_connection(dest), df, name, ...)
}
<bytecode: 0x5646b227a9d0>
<environment: namespace:sparklyr>

copy_to.spark_connection只是调用sdf_copy_to

代码语言:javascript
运行
复制
#> sparklyr:::copy_to.spark_connection
function (dest, df, name = spark_table_name(substitute(df)), 
    overwrite = FALSE, memory = TRUE, repartition = 0L, ...) 
{
    sdf_copy_to(dest, df, name, memory, repartition, overwrite, 
        ...)
}
<bytecode: 0x5646b21ef120>
<environment: namespace:sparklyr>

sdf_copy_to遵循包范围的约定,即在与Spark DataFrames相关的函数前面加上前缀"sdf_"。另一方面,copy_to是由dplyr提供的,sparklyr为方便dplyr用户提供了兼容的方法。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56148836

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档