前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >通用的load和save操作

通用的load和save操作

作者头像
编程那点事
发布2023-02-25 15:51:10
2920
发布2023-02-25 15:51:10
举报
文章被收录于专栏:java编程那点事

对于Spark SQL的DataFrame来说,无论是从什么数据源创建出来的DataFrame,都有一些共同的load和save操作。load操作主要用于加载数据,创建出DataFrame;save操作,主要用于将DataFrame中的数据保存到文件中。

Java版本

代码语言:javascript
复制
DataFrame df = sqlContext.read().load("users.parquet");

df.select("name", "favorite_color").write().save("namesAndFavColors.parquet");

Scala版本

代码语言:javascript
复制
val df = sqlContext.read.load("users.parquet")

df.select("name", "favorite_color").write.save("namesAndFavColors.parquet")

第一步上传user.parquet文件

代码语言:javascript
复制
Hadoop fs -put user.parquest /

第二步上传jar包

Java代码如下:

代码语言:javascript
复制
public class GenericLoadSave {

​public static void main(String[] args) {

​​SparkConf conf = new SparkConf()​​.setAppName("GenericLoadSave").setMaster("local");

JavaSparkContext sc = new JavaSparkContext(conf);

SQLContext sqlContext = new SQLContext(sc);

DataFrame usersDF = sqlContext.read().load(​"hdfs://spark1:9000/users.parquet");

usersDF.show();
}
}




 
public class GenericLoadSave {

​public static void main(String[] args) {

​​SparkConf conf = new SparkConf()​​.setAppName("GenericLoadSave");

JavaSparkContext sc = new JavaSparkContext(conf);

SQLContext sqlContext = new SQLContext(sc);

DataFrame usersDF = sqlContext.read().load(​"hdfs://spark1:9000/users.parquet");      
usersDF.select("name","favorite_color").write().save("namesAndColors.parquet");

}
}

Scala版本

代码语言:javascript
复制
import org.apache.spark.SparkConf

import org.apache.spark.sql.SQLContext

import org.apache.spark.SparkContext

object GenericLoadSave {

def main(args: Array[String]){

val conf = new SparkConf().setAppName("GenericLoadSave")

val sc = new SparkContext(conf)

val sqlContext = new SQLContext(sc)
val usersDF = sqlContext.read.load("hdfs://spark1:9000/users.parquet")
usersDF.select("name", "favorite_color").write.save("hdfs://spark1:9000/namesAndFavColors.parquet")
}
}
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-02-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档