HiveContext vs spark sql - 腾讯云开发者社区

文章/答案/技术大牛

发布

Flink SQL vs Spark SQL

Spark SQL 的核心是Catalyst优化器，首先将SQL处理成未优化过的逻辑计划（Unresolved Logical Plan），其只包括数据结构，不包含任何数据信息。...也就是说和spark不同， flink 的SQL Parsing, Analysing, Optimizing都是托管给calcite(flink会加入一些optimze rules)....逻辑和spark类似，只不过calcite做了catalyst的事（sql parsing,analysis和optimizing）代码案例首先构建数据源，这里我用了'18-'19赛季意甲联赛的射手榜数据...SQL import org.apache.spark.sql.Dataset; import org.apache.spark.sql.SparkSession; public class SparkSQLTest...subscription.packtpub.com/book/big_data_and_business_intelligence/9781785889271/8/ch08lvl1sec58/the-spark-sql-architecture

4K3 2

Spark SQL发展史

Spark 1.0版本开始，推出了Spark SQL。其实最早使用的，都是Hadoop自己的Hive查询引擎；但是后来Spark提供了Shark；再后来Shark被淘汰，推出了Spark SQL。...SQLContext 要使用Spark SQL，首先就得创建一个创建一个SQLContext对象，或者是它的子类的对象，比如HiveContext的对象。...——HiveContext。...对于Spark 1.3.x以上的版本，都推荐使用HiveContext，因为其功能更加丰富和完善。 Spark SQL还支持用spark.sql.dialect参数设置SQL的方言。...对于SQLContext，它只支持“sql”一种方言。对于HiveContext，它默认的方言是“hiveql”

6472 0

您找到你想要的搜索结果了吗？

是的

没有找到

【Spark篇】---SparkSQL on Hive的配置和使用

一、前述 Spark on Hive： Hive只作为储存角色，Spark负责sql解析优化，执行。...二、具体配置 1、在Spark客户端配置Hive On Spark 在Spark客户端安装包下spark-1.6.0/conf中创建文件hive-site.xml： ...1 import org.apache.spark.sql.hive.HiveContext val hc = new HiveContext(sc) hc.sql("show databases")...HiveContext hiveContext = new HiveContext(sc); hiveContext.sql("USE spark"); hiveContext.sql("DROP TABLE...*/ val hiveContext = new HiveContext(sc) hiveContext.sql("use spark") hiveContext.sql("drop table

4.6K1 2

Hadoop vs Spark

Hadoop vs Spark Big Data Architecture https://www.youtube.com/watch?v=xDpvyu0w0C8

2593 0

《SparkSql使用教程》--- 大数据系列

一、SQLContext、HiveContext、SparkSession SQLContext：是spark sql的一个分支入口，可以用来操作sql，这个主要是针对spark来说 HiveContext...：是spark sql中另外分支，用来操作hive。...-1.0.jar \ /root/app/spark-2.3.0/examples/src/main/resources/people.json 三、HiveContext的使用 1、首先要添加相应的依赖...>${spark.version} 2、建一个Scala应用程序 /** * hiveContext的使用 */object HiveContextApp...= new HiveContext(sc) //2)相关处理：json hiveContext.table("emp").show() //3)关闭资源 sc.stop(

1K2 0

【Spark篇】---SparkSQL中自定义UDF和UDAF，开窗函数的应用

; import org.apache.spark.sql.DataFrame; import org.apache.spark.sql.Row; import org.apache.spark.sql.RowFactory...; import org.apache.spark.sql.types.DataTypes; import org.apache.spark.sql.types.StructField; import...; import org.apache.spark.sql.SaveMode; import org.apache.spark.sql.hive.HiveContext; /**是hive的函数，必须在集群中运行...hiveContext = new HiveContext(sc); hiveContext.sql("use spark"); hiveContext.sql("drop...= new HiveContext(sc) hiveContext.sql("use spark"); hiveContext.sql("drop table if exists sales");

1.9K2 0

Spark Insert Hbase解决task not to serializable

org.apache.hadoop.hbase.client.HTable; import org.apache.hadoop.hbase.client.Put; import org.apache.spark.SparkConf...; import org.apache.spark.api.java.JavaSparkContext; import org.apache.spark.api.java.function.VoidFunction...; import org.apache.spark.sql.DataFrame; import org.apache.spark.sql.Row; import org.apache.spark.sql.hive.HiveContext...).setAppName("SparkInsertHbase"); JavaSparkContext sc = new JavaSparkContext(conf); HiveContext...hiveContext = new HiveContext(sc.sc()); DataFrame df = hiveContext.sql("select id,name from

1K1 0

让你真正理解什么是SparkContext, SQLContext 和HiveContext

SQL 查询引擎。...SparkSQL 有SQLContext 和HiveContext.HiveContext 继承SQLContext.Hortonworks 和 Spark社区建议使用HiveContext.你可以看到下面...，当你运行spark-shell,它和driver应用程序是交互的，他会自动创建SparkContext 定义为sc和HiveContext 定义为sqlContext.HiveContext 允许执行...sql查询以及Hive 命令.pyspark同样也是。...你可以看下 Spark 1.3.1 文档，SQLContext 和HiveContext 在SQLContext documentation and HiveContext documentation（

3.3K9 0

spark学习笔记：spark sql

org.apache.spark.sql.SQLContext import org.apache.spark....{SparkConf, SparkContext} import org.apache.spark.sql.SparkSession import org.apache.spark.sql.hive.HiveContext...= new HiveContext(sparkContext) val sqlContext = new SQLContext(sparkContext) val spark = SparkSession.builder...val sqlQuery = Source.fromFile( dataSqlFile ).mkString val dataSqlFrame = SparkConfTrait.spark.sql...val sqlQuery = Source.fromFile( dataSqlFile ).mkString val dataSqlFrame = SparkConfTrait.hiveContext.sql

7921 0

3.sparkSQL整合Hive

spark SQL经常需要访问Hive metastore，Spark SQL可以通过Hive metastore获取Hive表的元数据。...但是如果要像hive一样持久化文件与表的关系就要使用hive，当然可以不启动hive程序使用spark提供的HiveContext类即可。　　...rdd.write.json("hdfs://192.168.19.131:9000/personresult") 使用org.apache.spark.sql.hive.HiveContext import...org.apache.spark.sql.hive.HiveContext val hiveContext = new HiveContext(sc) hiveContext.sql("select...spark sql可视化第一种方案: 将spark sql代码打包，sql语句和结果存储位置作为参数，java代码收集这些参数后，组装为命令，调用脚本来向集群提交jar包。

2.9K3 0

Hive数据源实战

Spark SQL支持对Hive中存储的数据进行读写。操作Hive中的数据时，必须创建HiveContext，而不是SQLContext。...将hive-site.xml拷贝到spark/conf目录下，将mysql connector拷贝到spark/lib目录下 HiveContext sqlContext = new HiveContext...; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaSparkContext; import org.apache.spark.sql.DataFrame...; import org.apache.spark.sql.Row; import org.apache.spark.sql.hive.HiveContext; /** * Hive数据源 *...import org.apache.spark.SparkContext import org.apache.spark.sql.hive.HiveContext /** * @author

7332 0

Spark Sql系统入门4：spark应用程序中使用spark sql

为了使用spark sql，我们构建HiveContext （或则SQLContext 那些想要的精简版）基于我们的SparkContext.这个context 提供额外的函数为查询和整合spark sql...// Import Spark SQL import org.apache.spark.sql.hive.HiveContext // Or if you can't have the hive dependencies...import org.apache.spark.sql.SQLContext Scala用户注意，我们不使用 import HiveContext....// Import Spark SQL import org.apache.spark.sql.hive.HiveContext; // Or if you can't have the hive dependencies...基本查询例子为了对一个表查询，我们调用HiveContext或则SQLContext的sql()函数.第一个事情，我们需要告诉spark sql关于一些数据的查询。

1.5K7 0

Spark Streaming VS Flink

图 1：Spark Streaming 生态，via Spark 官网 ?...Spark Streaming Spark Streaming 与 kafka 的结合主要是两种模型：基于 receiver dstream；基于 direct dstream。.../ 任务调度原理 / Spark 任务调度 Spark Streaming 任务如上文提到的是基于微批处理的，实际上每个批次都是一个 Spark Core 的任务。...图 8 Spark 时间机制 Spark Streaming 只支持处理时间，Structured streaming 支持处理时间和事件时间，同时支持 watermark 机制处理滞后数据。...Spark Streaming 的背压 Spark Streaming 跟 kafka 结合是存在背压机制的，目标是根据当前 job 的处理情况来调节后续批次的获取 kafka 消息的条数。

1.9K2 2

java使用sparkspark-sql处理schema数据

累加器（accumulators）：只能用于做加法的变量，例如计算器或求和器 3、spark-sql spark-sql是将hive sql跑在spark引擎上的一种方式，提供了基于schema处理数据的方式...4、代码详解 java spark和spark-sql依赖。...; import org.apache.spark.sql.SQLContext; import org.apache.spark.api.java.JavaSparkContext; import org.apache.spark.sql.hive.HiveContext...2、这里在通过spark-sql读取到row数据之后，将schema解析出来，并且映射为hashmap。...%s", db ,table); System.out.println(query); DataFrame rows = hiveContext.sql(

1.1K5 0

Spark SQL

概述官方地址 http://spark.apache.org/sql/ Spark SQL是Spark用来处理结构化数据的一个模块，它提供了2个编程抽象：DataFrame和DataSet，并且作为分布式...SQL查询引擎的作用。...DataFrame SparkSQL使用的数据抽象是DataFrame ,DataFrame让Spark具备了处理大数据结构化数据的能力，它不仅比原来的RDD转换方式更加简单易用，而且获得了更高的计算能力...Spark 能够轻松实现从Mysql到DataFrame的转化，并且支持SQL查询。...image.png DataFrame创建从Spark2.0以上版本开始，Spark使用全新的SparkSession接口代替Spark1.6的SQLContex以及HiveContext接口

7911 0

Spark学习之Spark SQL（8）

Spark学习之Spark SQL（8） 1. Spark用来操作结构化和半结构化数据的接口——Spark SQL、 2....2.2 Spark SQL不仅支持在Spark程序内使用SQL语句进行查询，也支持从类似商业智能软件Tableau这样的外部工具中通过标准数据库连接器（JDBC/ODBC）连接Spark SQL进行查询...2.3 当在Spark程序内使用Spark SQL时，Spark SQL支持SQ与常规的Python/Java/Scala代码高度整合，包括连接RDD与SQL表、公开的自定义SQL函数接口等。 3....在应用使用Spark 5.1 初始化Spark //Sacla中SQL的import的声明 import org.apache.spark.sql.hive.HiveContext...//创建HiveContext import hiveCtx.

1.2K7 0

Spark将Dataframe数据写入Hive分区表的方案

向hive数据仓库写入数据必须指定数据库，hive数据表建立可以在hive上建立，或者使用hiveContext.sql("create table .....")...val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc) import hiveContext.implicits._ hiveContext.sql...2、将DataFrame数据写入hive指定数据表的分区中 hive数据表建立可以在hive上建立，或者使用hiveContext.sql("create table....")...,使用saveAsTable时数据存储格式有限，默认格式为parquet，将数据写入分区的思路是：首先将DataFrame数据写入临时表，之后由hiveContext.sql语句将数据写入hive分区表中...val hiveContext = new org.apache.spark.sql.hive.HiveContext(sc) import hiveContext.implicits._ hiveContext.sql

16.8K3 0

Spark SQL

：Spark SQL和Hive on Spark。...（二）Spark SQL架构 Spark SQL架构如图所示，Spark SQL在Hive兼容层面仅依赖HiveQL解析、Hive元数据，也就是说，从HQL被解析成抽象语法树（AST）起...，就全部由Spark SQL接管了。...三、DataFrame的创建从Spark2.0以上版本开始，Spark使用全新的SparkSession接口替代Spark1.6中的SQLContext及HiveContext接口来实现其对数据加载...SparkSession实现了SQLContext及HiveContext所有功能。

3971 0

Spark 在Spark2.0中如何使用SparkSession

执行一些分析，然后运行 Spark SQL 查询，而无需访问 SparkContext，SQLContext 或 HiveContext。...SQL 通过 SparkSession，你可以像通过 SQLContext 一样访问所有 Spark SQL 功能。...正如你所看到的，输出中的结果通过使用 DataFrame API，Spark SQL和Hive查询运行完全相同。...通过 SparkContext，Driver 可以访问其他上下文，如SQLContext，HiveContext和 StreamingContext 来编程Spark。...以前通过 SparkContext，SQLContext 或 HiveContext 在早期版本的 Spark 中提供的所有功能现在均可通过 SparkSession 获得。

5K6 1

Spark SQL实战(04)-API编程之DataFrame

1 SparkSession Spark Core: SparkContext Spark SQL: 难道就没有SparkContext？...() } } 1.x的Spark SQL编程入口点 SQLContext HiveContext Spark SQL中，SQLContext、HiveContext都是用来创建DataFrame和Dataset...SQL语言支持：SQLContext和HiveContext都支持Spark SQL中的基本语法，例如SELECT、FROM、WHERE等等。...但HiveContext还支持Hive中的所有SQL语法，例如INSERT、CREATE TABLE AS等等。...Spark 2.x后，HiveContext已被SparkSession替代，因此推荐SparkSession创建DataFrame、Dataset。

4.6K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Flink SQL vs Spark SQL

Spark SQL发展史

【Spark篇】---SparkSQL on Hive的配置和使用

Hadoop vs Spark

《SparkSql使用教程》--- 大数据系列

【Spark篇】---SparkSQL中自定义UDF和UDAF，开窗函数的应用

Spark Insert Hbase解决task not to serializable

让你真正理解什么是SparkContext, SQLContext 和HiveContext

spark学习笔记：spark sql

3.sparkSQL整合Hive

Hive数据源实战

Spark Sql系统入门4：spark应用程序中使用spark sql

Spark Streaming VS Flink

java使用sparkspark-sql处理schema数据

Spark SQL

Spark学习之Spark SQL（8）

Spark将Dataframe数据写入Hive分区表的方案

Spark SQL

Spark 在Spark2.0中如何使用SparkSession

Spark SQL实战(04)-API编程之DataFrame

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐