3.Spark SQL概述
image.png
Shark终止后,产生了两个分支:
image.png
官网:http://spark.apache.org/sql/
Spark SQL is Apache Spark's module for working with structured data.
image.png
image.png
image.png
image.png
Spark SQL不仅仅有访问或者操作SQL的功能,他还提供了其他的非常丰富的操作:外部数据源,优化
Spark SQL概述小结: 1.Spark Sql并不局限于SQL 2.可以访问hive、json、parquet等文件的数据 3.SQL只是Spark SQL 的一个功能而已===>这个名字并不恰当 4.Spark SQL提供了SQL的api,DataFrame,Dataset的API
image.png