前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Spark2.3.1使用技巧

Spark2.3.1使用技巧

作者头像
笨兔儿
发布2019-05-26 11:10:17
3980
发布2019-05-26 11:10:17
举报
文章被收录于专栏:笨兔儿笨兔儿

Spark 2.3.1 使用技巧

Spark-SQL 读取JSON文件时反射表头

代码语言:javascript
复制
case class StudentInfo(id:Long,name:String,age:Int)

val example = spark.read.json("/data/result.json").as(StudentInfo)
example.show()

动态定义schema

在需要根据不同数据定义不同schema

代码语言:javascript
复制
val schemaInfo = "name age"
val fields = schemaInfo.map(item=> item.split(" ")
     .map(item=>StructField(item,StringType,nullable=true))
val schema = StructType(fields)

val rowRDD = peopleRDD.map(_.split(" ").map(attributes=>Row(attributes(0),attributes(1))

val peopleDF = spark.createDataFrame(rowRDD,schema)

peopleDF.show()

Spark 2.3.1 on YARN

spark-submit 限制参数未生效

因为在spark-submit时配置的executor-memory 2g等没有生效,后来问同事说他也碰到这样的问题,解决方案就是动态的分配executor,官方文档,中文文档

代码语言:javascript
复制
--conf spark.yarn.maxAppAttempts=1 --conf spark.dynamicAllocation.minExecutors=2 --conf spark.dynamicAllocation.maxExecutors=4 --conf spark.dynamicAllocation.initialExecutors=4
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Spark 2.3.1 使用技巧
    • Spark-SQL 读取JSON文件时反射表头
      • 动态定义schema
      • Spark 2.3.1 on YARN
        • spark-submit 限制参数未生效
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档