如何在色调查询中执行hivesql后停止'hive on spark‘作业

文章/答案/技术大牛

发布

1回答

apache-spark、hive、hue、cloudera-manager

我的母舰引擎是spark。当我执行hivesql in hue查询时，总是会启动一个hive on spark作业，而且它不会停止。 ?

浏览 39提问于2019-06-19得票数 0

2回答

蜂巢节约服务器与星火分布的区别

java、hadoop、jdbc、hive、thrift

使用以下两个命令之一运行hive服务器有什么区别：从spark/sbin$ .

浏览 1提问于2015-03-17得票数 8

1回答

无法将查询传递到Yarn群集模式下的java spark程序

java、apache-spark、talend

Talend 7.1、MapR6.0分发版、Spark 2.2、查询可以有复杂的配置单元连接&有时用户甚至可以使用特殊字符反引号、！、tilda、

浏览 1提问于2021-03-05得票数 0

1回答

在Hive上触发SQL查询执行

apache-spark、hive、apache-spark-sql

我对Spark很陌生，但我知道hive查询执行框架。我想了解spark如何执行sql查询(技术描述)？如果我在命令下开火sqlContext.sql("select count(distinct(id)) from test.emp").collect 在蜂巢中，它将被转

浏览 1提问于2016-03-23得票数 2

1回答

星星之火，总是错误的executor_cores在工作申请从火花主web用户界面。

apache-spark、docker、hive

我试图把hive 2.1.1上的地图还原为蜂箱的火花。正如在星星之火官方网站上的hive中所告诉的那样，我构建了一个spark 1.6.0(比如在hive2.1.1源代码中触发rev )，而不使用hive。我设置了在spark-env.sh中。但是，在我从h

浏览 4提问于2017-05-02得票数 0

1回答

Spark与Hive的差异与ANALYZE TABLE命令-

apache-spark、pyspark、apache-spark-sql、pyspark-sql

从Spark对Hive表运行的ANALYZE TABLE命令不会提供与从Hive发出的相同命令相同的性能改进。例如，我将一个数据帧插入到一个空的Hive表中： output.write.insertInto(“XXXXXXXX”) 然后运行analyze table命令：- spark.sql("ANALYZETABLE XXXXXXXX COMPUTE STATISTICS") 当我在Hive中做记录计数时，它非常慢： selec

浏览 261提问于2019-01-05得票数 2

回答已采纳

2回答

星火错误的蜂巢java.lang.NoSuchFieldError: SPARK_RPC_SERVER_ADDRESS

apache-spark、hive、hadoop2

使用简单的select * from table查询在Spark上运行Hive，运行平稳，但是在联接和和时，ApplicationMaster返回关联的火花容器的堆栈跟踪： at org.apache.hive.spark.client.rpc.RpcConfiguration<clinit>(RpcConfiguration.java

浏览 2提问于2019-03-29得票数 2

回答已采纳

1回答

如何在spark* sql中设置配置单元参数和多个语句*

apache-spark、apache-spark-sql

因此，当在该表上触发配置单元查询时，新行数据将被视为新记录，我可以在配置单元中通过设置参数"set hive.query.result.fileformat=SequenceFile;“克服这一问题。现在，我正在迁移此参数和MR查询，以便在spark sql中运行。此外，我还想在实际查询之前运行一些其他查询，如drop table语句。我的代码如下所示 spark.sql(set hive

浏览 10提问于2018-08-08得票数 0

2回答

如何修复ADLS Gen 2中的Delta位置文件？

pyspark、apache-spark-sql、databricks、azure-databricks、azure-data-lake-gen2

我正在使用ADF中的Dataflows在ADLS Gen2中执行增量文件的截断和加载。在管道成功运行之后，如果我试图读取Azure数据块中的文件，我将得到以下错误。我发现消除这种情况的一种方法是重新启动亚行中的集群。但是，有没有更好的方法来解决这个问题呢？

浏览 0提问于2020-11-04得票数 1

回答已采纳

1回答

不使用所有可用的CPU

apache-spark、hive

我正在使用星火上的Hive运行一个查询，它显示了一些奇怪的行为。我已经运行了多次，并观察到了同样的行为。查询：这工作一开始一切都很好。2800 CPU运行1.5h后，任务完成率为80%(800 k/990k任务)。从那时起，事情就开始急

浏览 1提问于2020-12-10得票数 0

回答已采纳

3回答

如何按顺序运行Hue Hive查询

hadoop、mapreduce、hive、hue、cloudera-cdh

问题是当我尝试从Hive编辑器(HUE GUI)运行hive查询时。如果我提交了5到6个查询(用于执行)，则会启动作业，但它们会挂起，永远不会运行。如何按顺序运行查询。我的意思是，即使我可以提交查询，但是新的查询只应该在前面的查询完成后才开始。有什么方法可以让查询一个一个地运行吗？

浏览 3提问于2014-09-23得票数 0

回答已采纳

1回答

Spark2中的SQLContext未获取更新的配置单元表记录

apache-spark、hive、apache-spark-sql

我有一个正在运行的应用程序，它使用HiveContext查询hive表，如果我在spark1.6中使用spark-submit运行应用程序，它工作得很好。我面临的问题是，一旦我启动上下文，hive表中的任何增量更改在hive查询结果中都不可见。我使用enableHiveSupport()启动SparkContext。如果我停止并重新启动应用程序，我可以看到行。写入数据的应用程序在写入后正在执

浏览 1提问于2019-01-16得票数 0

1回答

Rest接口到HDInsight Spark以提交作业和读取结果

azure、hadoop、apache-spark-sql、azure-hdinsight

我已经在Azure上的HDInsight中设置了一个Spark集群，我有一个服务thaqt定期将数据推入到HDInsight blob存储中，并在此基础上创建了一个Hive外部表。我能够使用木星并执行一些Spark查询并查看结果。现在，我有了一个ASP.Net网站，它需要在用户请求时执行类似的Spark查询作业，并在网页上显示结果。我看到HDInsight星体集群集群附带了Livy，但我没有看到任

浏览 5提问于2016-04-14得票数 0

1回答

如何使火花放电和SparkSQL在星火上执行蜂巢？

python、apache-spark、pyspark、hive、apache-spark-sql

通过使用hive / beeline，我还可以创建Hive表，加载数据，然后进行适当的选择。蜂箱在纱线/火花上正确地执行。我怎么知道它起作用了？，我还可以访问ApplicationMaster查看详细查询。我想做的事。将$SPARK_HOME/conf/hive-site.xml编辑为<e

浏览 0提问于2020-02-23得票数 0

回答已采纳

2回答

当HDFS已经提供数据存储时，为什么还要使用Hive？

hadoop、hive、hdfs

从Hive的定义来看，它是一个构建在hadoop上的数据仓库，用于提供类似SQL的接口。我的问题是，当hadoop提供容错、分布式的HDFS时，为什么要使用hive？hive会取代HDFS吗？hive是否也只提供sql接口或存储？

浏览 1提问于2018-07-26得票数 0

2回答

蜂巢MetaStore的主要用途？

hadoop、hive、hive-metastore

当您在蜂巢中创建一个表时：LOAD DATA INPATH <HDFS_file_location> INTO table managed_table; 因此，我知道这个命令接受HDFS中文件的内容，并创建它的MetaData表单并将其存储在MetaStore中(包括列类型、列名、它在HDFS中的位置等它实际上并没有将数据从HDFS移动到Hive中。

浏览 0提问于2018-01-31得票数 2

回答已采纳

5回答

以s3为数据的亚马逊网络服务中的ETL流水线如何处理增量更新

amazon-web-services、amazon-s3、etl、amazon-data-pipeline、aws-glue

我已经在AWS中设置了ETL管道，如下所示b.)如何处理重复记录获取查询的最新时间戳。在spark脚本中，是否需要创建Hive外部表，源为s3，并在presto db中使用？

浏览 0提问于2017-09-06得票数 4

5回答

Apache Tez架构说明

hadoop、hive

我想知道是什么让Apache Tez的hive比map reduce的Hive快得多。我不能理解DAG的概念。任何人都有很好的参考资料来理解Apache TEZ的体系结构。

浏览 0提问于2014-08-27得票数 8

1回答

利用Apache火花数据

persistence、redis、cassandra、apache-kafka、spark

目前，我正在阅读关于Kafka & Spark的教程，有些事情我无法理解:如何利用/公开收到的数据。我读过很多来自Spark的特性，它可以使用内存中的存储(也可以被持久化或缓存)将RDDs转换成其他RDD(基本上)。但是后来呢？然后，我希望用户能够查询所有这些持久化数据:一个简单的REST来获取最新的事件值-一个复杂的类似查询的系统来获取事件日志-一些报告API来获得ML算法的预测。如何通过星火实现这一目标？

浏览 0提问于2017-02-16得票数 2

回答已采纳

6回答

在Cloudera Docker QuickStart上访问色调

hadoop、docker、cloudera、cloudera-quickstart-vm

hostname=quickstart.cloudera -p 7180 -p 8888 -t -i 9f3ab06c7554 /usr/bin/docker-quickstart/home/cloudera/cloudera-manager --express --force现在在我的主机上，我

浏览 1提问于2015-12-21得票数 18

点击加载更多