Databricks是spark商业孵化公司,主要做的工作是在AWS上提供SaaS化的spark服务。最近在databricks博客上公布了做的一些有意思的进展:
Databricks把这个称为Runtime artifact,包括Apache Spark和其他软件,如Scala,Python,DBIO和DBES。
以前,云上的版本和spark是同一个版本,Databricks准备和spark版本解耦出来,单独命名版本号,Databricks Runtime3.0配套spark 2.2。
相比spark,Databricks Runtime显著区别是:
相关博客:https://databricks.com/blog/2017/05/24/databricks-runtime-3-0-beta-delivers-enterprise-grade-apache-spark.html?utm_campaign=Databricks%20newsletter&utm_source=hs_email&utm_medium=email&utm_content=52589187&_hsenc=p2ANqtz--fpyaZ-Uf5AsJjJFjlmNbmLM1AhThXVAjmiB2Bs6QW5-oUsCj33orPZYangsTF3l6GqOsBC3B2ggwxE_q2JYL7IgFRQw&_hsmi=52590058