前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >spark dataframe 数据 转化为 json 或者自定义格式的字符串

spark dataframe 数据 转化为 json 或者自定义格式的字符串

作者头像
流川疯
发布2021-12-06 16:26:46
1.1K0
发布2021-12-06 16:26:46
举报
文章被收录于专栏:流川疯编写程序的艺术

文章大纲

创建dataframe

代码语言:javascript
复制
  import org.apache.spark.sql.types._
      val schema = StructType(List(
        StructField("integer_column", IntegerType, nullable = true),
        StructField("string_column", StringType, nullable = true),
        StructField("date_column", DateType, nullable = true)
      ))


      val rdd = spark.sparkContext.parallelize(Seq(
        Row(1, "First Value", java.sql.Date.valueOf("2010-01-01")),
        Row(2, "Second Value", java.sql.Date.valueOf("2010-02-01")),
        Row(null, "Second Value", java.sql.Date.valueOf("2010-02-01"))
      ))
在这里插入图片描述
在这里插入图片描述

官方的方法

代码语言:javascript
复制
df_fill.toJSON.collectAsList.toString

自定义格式

代码语言:javascript
复制
package utils

import org.apache.spark.sql.DataFrame
object MyDataInsightUtil {

  def dataFrame2Json(data:DataFrame,num:Int=10)={
    val dftopN = data.limit(num)

    val arr = dftopN.collect().map(x=>x.toSeq.mkString("\"","\",\"","\"")).mkString("|")

    val columnName = (dftopN.columns.mkString("\"","\",\"","\""))

    (columnName+"|"+ arr)
  }

}

结果:

代码语言:javascript
复制
 填充后结果
 “integer_column”,“string_column”,“date_column”|“1”,“First Value”,“2010-01-01”|“2”,“Second Value”,“2010-02-01”|"-3",“Second Value”,“2010-02-01”
 原始结果
 “integer_column”,“string_column”,“date_column”|“1”,“First Value”,“2010-01-01”|“2”,“Second Value”,“2010-02-01”|“null”,“Second Value”,“2010-02-01”
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/05/18 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章大纲
  • 创建dataframe
  • 官方的方法
  • 自定义格式
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档