首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >为什么星火中的RDD、Dataframe和Dataset被称为Api?

为什么星火中的RDD、Dataframe和Dataset被称为Api?
EN

Stack Overflow用户
提问于 2021-09-08 11:29:27
回答 1查看 167关注 0票数 1

我开始阅读书名为“火花权威指南-大数据处理变得简单”来学习火花。在我阅读的时候,我看到一句话:"A DataFrame是最常见的结构化API,它只是表示带有行和列的数据表。“我无法理解为什么RDDs和DataFrames被称为API?

EN

回答 1

Stack Overflow用户

发布于 2021-09-08 11:37:35

它们被称为API,因为它们本质上只是对完全相同的数据的不同接口。DataFrame可以建立在RDD的基础上,RDD可以从DataFrame中提取。它们只是在数据上定义了不同的函数集,主要的区别是语义和处理数据的方式,RDD是较低级别的API,DataFrame是较高级别的API。例如,您可以在DataFrame中使用Spark接口,它提供了所有常见的SQL函数,但是如果您决定使用RDD,则需要使用RDD转换自己编写SQL函数。

当然,它们都存在,因为它们实际上取决于您的用例。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69102202

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档