/export/server/spark/sbin/start-thriftserver.sh \

--hiveconf hive.server2.thrift.port=10000 \

--hiveconf hive.server2.thrift.bind.host=node1 \

--master local[2]

停止使用:在实际大数据分析项目中，使用SparkSQL时，往往启动一个ThriftServer服务，分配较多资源（Executor数目和内存、CPU），不同的用户启动beeline客户端连接，编写SQL语句分析数据。

/export/server/spark/sbin/stop-thriftserver.sh

使用beeline 客户端连接

使用SparkSQL的beeline客户端命令行连接ThriftServer，启动命令如下：

/export/server/spark/bin/beeline

!connect jdbc:hive2://node1:10000

root

123456

show database;编写SQL语句执行分析：

show tables;

select * from person;

监控WEB UI界面：

http://node1:4040/jobs/

JDBC/ODBC 客户端

参考文档：https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-JDBC

SparkSQL中提供类似JDBC/ODBC方式，连接Spark ThriftServer服务，执行SQL语句，首先添加Maven依赖库：

<dependency>

            <groupId>org.apache.spark</groupId>

            <artifactId>spark-hive-thriftserver_2.11</artifactId>

            <version>${spark.version}</version>

</dependency>

范例演示：采用JDBC方式读取Hive中db_hive.emp表的数据。

package cn.itcast.sql

import java.sql.{Connection, DriverManager, PreparedStatement, ResultSet}

/**
  * SparkSQL 启动ThriftServer服务，通过JDBC方式访问数据分析查询
  */
object SparkThriftJDBC {
    def main(args: Array[String]): Unit = {
        // 定义相关实例对象，未进行初始化
        var conn: Connection = null
        var ps: PreparedStatement = null
        var rs: ResultSet = null

        try {
            // TODO： a. 加载驱动类
            Class.forName("org.apache.hive.jdbc.HiveDriver")
            // TODO: b. 获取连接Connection
            conn = DriverManager.getConnection(
                "jdbc:hive2://node1:10000/default",
                "root",
                "123456"
            )
            // TODO: c. 构建查询语句
            val sqlStr: String =
                """
                  |select * from person
                """.stripMargin
            ps = conn.prepareStatement(sqlStr)
            // TODO: d. 执行查询，获取结果
            rs = ps.executeQuery()
            // 打印查询结果
            while (rs.next()) {
                println(s"id = ${rs.getInt(1)}, name = ${rs.getString(2)}, age = ${rs.getInt(3)}}")
            }
        } catch {
            case e: Exception => e.printStackTrace()
        } finally {
            if (null != rs) rs.close()
            if (null != ps) ps.close()
            if (null != conn) conn.close()
        }
    }
}

2021年大数据Spark - Lanson

2021年大数据Spark（三十三）：SparkSQL分布式SQL引擎

分布式SQL引擎

Hive的SQL交互方式

ThriftServer JDBC/ODBC Server

开启sparksql的thriftserver

使用beeline 客户端连接

JDBC/ODBC 客户端

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐