前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Spark 2.2 on K8S 和 Kubernetes v1.14

Spark 2.2 on K8S 和 Kubernetes v1.14

作者头像
runzhliu
发布2020-08-06 10:37:26
3190
发布2020-08-06 10:37:26
举报
文章被收录于专栏:容器计算容器计算

文章目录

就像之前写过很多关于 Spark on K8S 的文章,Spark 2.2 是 Fork 出来的版本,虽然经受住了我们部门超大规模的 Spark 计算业务的考验,但是由于 Spark 社区很快就在 2.3 跟进了 on K8S 的模块,所以 Spark 2.2 是很早就被废弃并且不维护的,所以如果此时还想用 Spark 2.2 上生产环境,是非常危险的,因为很多 Bug,是得不到反馈的,所以建议用户都放弃 Spark 2.2 on K8S 的方案吧。

近期我们业务遇到一个问题,也是跟 Spark 2.3/2.4 类似的问题,因为 Kubernetes 的版本更新迭代非常快,很多公司内部的 K8S 版本不太可能一直保持跟社区一样的节奏,落后好几个小版本是常有的事情,比如说我们目前还有 v1.8 的内部版本,里面很多特性跟最新版的设计可以说是非常不同的。

再说说问题本身,大概就是 Kubernetes 的 Java Client 跟 Api Server 通信的问题。

image_1e4auilv68h6dj2uff1jd7rtq9.png-391.1kB
image_1e4auilv68h6dj2uff1jd7rtq9.png-391.1kB

相关 issue 和讨论地址:

  1. https://issues.apache.org/jira/browse/SPARK-28925
  2. https://andygrove.io/2019/08/apache-spark-regressions-eks/
  3. https://github.com/kubernetes/kubernetes/issues/82131

当然了,替换 jar 包之后,运行 SparkPi 是没问题的,但是如果给业务跑,我相信还有很多问题和坑,而且是没人愿意去解决的,所以…还是尽早摆脱 Spark 2.2 吧,本来 on K8S 的设计,2.3+ 跟 2.2 也区别很大了。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-03-26 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章目录
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档