首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

使用 Spark | 手把手带你十步轻松拿下 Spark SQL 使用操作

DataFrame/DataSet RDD 这个转换比较简单,直接调用 rdd 即可将 DataFrame/DataSet 转换为 RDD: val rdd1 = testDF.rdd val rdd2...RDD DataSet 定义 case class,通过反射来设置 Schema,使用 toDS 进行转换: case class Person(name:String, age:Int) val...DataSet DataFrame 直接调用 toDF,即可将 DataSet 转换为 DataFrame: val peopleDF4 = peopleDS.toDF peopleDF4.show...4.4 读取数据源,加载数据(RDD DataFrame) 读取上传到 HDFS 中的广州二手房信息数据文件,分隔符为逗号,将数据加载到上面定义的 Schema 中,并转换为 DataFrame 数据集...RDD DataSet 重新读取并加载广州二手房信息数据源文件,将其转换为 DataSet 数据集: val houseRdd = spark.sparkContext.textFile("hdfs

8.2K51
领券