hive和mysql联合查询_hive和mysql联合查询语句_mysql联合查询 - 腾讯云开发者社区

、、、

目前，我正在执行以下步骤(hadoop 1.1.2、Hive 0.11和Sqoop-1.4.3.bin__hadoop-1.0.0)：使用Sqoop将数据从MySQL导入到Hive 在Hive中执行查询并将其输出存储在Hive表中。使用Sqoop将输出导出到MySQL 我想知道是否可以将步骤2和步骤3--直接写入MySQL数据库的Hive查询的输出--结合起来。我阅读了外部表，但是找不到一个例子，其中LOCATION子句指向jdbc:myql://localhost:3306//。真的有可能吗？线程谈到JDBC，但找不到同样的Hive示例(我猜它没有实现！)

浏览 1提问于2013-07-18得票数 1

2回答

关于蜂巢的问题

、、、

我有这样的环境： .slaves=‘slaves 5’>应用程序: ambari，hue，hive，sqoop，hdfs .生产中的服务器(与hadoop分离)和mysql数据库。我的目标是：优化在此mysql服务器上进行的查询，这些查询现在执行起来很慢。我做了什么：我使用Sqoop将mysql数据导入到HDFS。我的怀疑是：我不能使用Hive在HDFS中直接选择吗？我是否必须将数据加载到Hive中并进行查询？如果将新数据输入mysql数据库，那么获取这些数据并将其插入HDFS并再次插入Hive的最佳方法是什么？(也许实时的

浏览 3提问于2017-02-15得票数 0

回答已采纳

1回答

在postgresql中，主键列需要自动递增

我在postgresql中创建了一个表： create table retail_fact( id serial not null, name text); 我有客户表在hive和MySQL中，我想从他们加载数据到PostgreSQL retail_fact表使用Pentaho pdi (通过presto连接)。另外，当我用Hive和MySQL中的数据加载表时，o希望id在Postgres中自动递增(用更简单的术语。我需要一个sql查询来做同样的事情)。查询类似于以下内容： insert into postgresql.rpt.order_fact( select name from h

浏览 0提问于2017-11-17得票数 1

3回答

同时使用Hive和MySql JDBC驱动程序

、、、

TL;DR:同时使用Hive和MySql JDBC会有问题吗？我正在开发一个应用程序，该应用程序使用MySql JDBC驱动程序执行多个SQL查询，之后它还使用Hive发送另一个Hive查询。现在发生的事情是MySql查询工作正常，当代码试图执行Hive查询时，它会抛出这个异常： com.mysql.cj.core.exceptions.WrongArgumentException: Connector/J cannot handle a database URL of type 'jdbc:hive2:'. at sun.reflect.NativeConstru

浏览 4提问于2016-10-19得票数 0

回答已采纳

1回答

基于蜂箱输入的mysql中Talend查询数据

、、

我需要在Hive中查询列，并根据MySQL DB中的输出查询它。流程如下所示：查询Hive表，获取ID列表使用ID列表查询MySQL表。查询将类似于select a,b,c from x where id in (list from hive) 我该怎么做？

浏览 1提问于2014-08-01得票数 3

回答已采纳

1回答

从点生成凸壳

、、、

我有一张有数千分的蜂巢桌。唯一的列是经度。我事先知道，这些点都在某个区域，而且这些点的极端外部边缘确实形成了一个连续多边形，但许多点是内部的。我试图确定哪些点是外部凸包，用于可视化。我不想使用所有的点，因为它有混乱的内部漏洞，看起来不太好的可视化。我用的是蜂巢-1.2.1000.2.4.2.0。以下是我尝试过的： hive> add jar /home/me/gis-tools-for-hadoop/samples/lib/esri-geometry-api.jar; Added [/home/me/gis-tools-for-hadoop/samples/lib/esri-geomet

浏览 5提问于2016-12-28得票数 0

回答已采纳

1回答

如何比较配置单元和mysql的性能

、、、、

我在hive和mysql中实现了相同的数据仓库星型模式。我认为Hive在查询响应时间方面更好。但我尝试了上千条记录，mysql似乎比hive更好。我认为Hive更好，有数百万条记录(以is为单位) 问题是我没有一百万条记录，也没有hadoop的硬件集群。我该怎么做呢？如果我假设有一个由10台服务器组成的集群，我可以将hive中的查询执行时间除以10？谢谢你

浏览 0提问于2014-03-12得票数 0

1回答

将查询结果从mysql导入到现有的hive表时出现的问题

当我试图将一个MySQL表导入到现有的hive表中时，下面的命令运行良好。但是，当我试图使用一个查询将结果导入到同一个hive表时，它是在请求--target-dir和--split-by。是否必须在导入查询结果时提供它们？为什么直接从表导入时不需要这些？我得到了下面的错误- 警告: /usr/lib/sqoop/../accumulo不存在！Accumulo的进口将失败。请将$ACCUMULO_HOME设置为Accumulo安装的根目录。19/03/29 02:50:40 INFO sqoop.Sqoop:运行Sqoop版本: 1.4.6-cdh5.13.0 19/03/29 02:50

浏览 0提问于2019-03-29得票数 0

回答已采纳

1回答

配置单元cdh4 thrift安装程序抛出NoSuchFieldError: METASTORE THRIFT重试

、、、、

我在RHEL5上使用mysql设置了Hive cdh4和远程remote。我在mysql中创建了一个数据库，名称与hive-site.xml中的名称相同。我启动了metastore服务器和hive服务器，但每当我尝试查询hive时，它都会抛出一个错误NoSuchFieldError: METASTORETHRIFTRETRIES。我相信我无法连接到metastore服务器或thrift服务器，这就是导致这个问题的原因。请给我指一条正确的路。

浏览 0提问于2013-04-29得票数 1

回答已采纳

1回答

如何将数据插入Hive(0.13.1)表？

、、

我使用的是Hive版本0.13.1。在尝试将数据插入现有表时，使用以下查询时会出现错误： CREATE TABLE table1 (order_num int, payment_type varchar(20), category varchar(20)); INSERT INTO TABLE table1 VALUES (151, 'cash', 'lunch'); 错误： ParseException第1行:25不能识别“VALUES”附近的输入( select子句中的“151”) 在搜索过程中，每个人都建议以上查询，但不幸的是，它并不适用于我。是因

浏览 2提问于2017-05-05得票数 2

回答已采纳

1回答

为什么导入到蜂箱失败并被表拒绝已经存在？

、、

我将一个表雇员从mysql导入到hdfs，没有任何问题；我将一个不同的表dep_emp导入 hive ，也成功了；我双重检查了蜂窝中只有两个表: myfirsthivetable和dep_emp，没有雇员；然后我尝试将表employees导入hive，但是我收到了错误信息： Output directory hdfs://localhost:9000/user/root/employees already exists 以下是我的导入查询： sqoop import --connect jdbc:mysql://localhost/employees --username root --P

浏览 2提问于2016-07-01得票数 0

回答已采纳

1回答

配置单元性能联合全部

、、

我有多个文件，使用配置单元union all通过单个文件组合它们，现在union all查询连接超过10个配置单元表，并且非常慢。每个单独的union all查询也有一个或多个联接条件。我期望的最终结果也需要按主键分组，例如： table 1 key1|val1|val2|.. table 2 key1|val10|val11|.. insert overwrite <temptable> select key, output_string from (select key, concat (col1,col2,..) from table 1 where <jo

浏览 2提问于2016-04-16得票数 2

1回答

MySQL群集顶部的配置单元层

、、、

免责声明:我是Hadoop和Hive的新手。我们已经设置了一个MySql集群(版本7.2.5)，它存储了大量数据。这些行达到数百万行，并基于Mysql的自动分片逻辑进行分区。尽管我们正在利用集群7.2的自适应查询本地化(AQL)，但我们的一些查询有多个连接，并且需要运行几分钟甚至几个小时。在这种情况下，我可以结合使用Hive和Hadoop来查询数据库和检索数据吗？它会使查询速度更快吗？它是否复制其文件系统中的数据？这种方法的优缺点是什么？我的意图是使用配置单元作为MySQL集群的顶层，并使用它对MySQL集群数据库进行读写。我的应用程序中没有任何事务。那么这真的是可能的吗？

浏览 0提问于2012-05-29得票数 1

回答已采纳

1回答

如何正确使用Sqoop的“创建-蜂窝表”？

、、、、

我试图使用Sqoop将数据从MySQL表导入到Hive。据我所知，有两种方法可以做到。将数据导入HDFS，然后在Hive中创建外部表并将数据加载到该表中。在运行Sqoop查询时使用create-hive-table在Hive中创建一个新表，并将数据直接加载到其中。我正试着做这件事，但出于某种原因我做不到这是我的密码 sqoop import \ --connect jdbc:mysql://localhost/EMPLOYEE \ --username root \ --password root \ --table emp \ --m 1 \ --hive-databa

浏览 3提问于2017-11-13得票数 0

2回答

蜂巢和黑斑羚的NOLOCK

、、、、

我想了解为什么我们在执行Impala、Hive或MySQL的SQL查询时不使用NOLOCK关键字。例如，我在工作时通过Cloudera工作台使用Hive和Impala。Cloudera工作台不识别NOLOCK关键字。类似地，我以前也使用过MySQL。即使在那里，诺洛克也不起作用。为什么我们不需要在Hive，Impala，MySQL或Big中使用NOLOCK呢？免责声明:我想澄清的是，我对NOLOCK特性及其用例有很好的理解。这个问题与不需要NOLOCK的SQL味道有关。

浏览 13提问于2022-02-03得票数 0

回答已采纳

1回答

蜂巢模式下的SemanticException

、

我已经在我的PC上安装了Hadoop 3.0.0和Hive 2.3.1。同时，我安装了mysql，并在shell模式下使用sql命令，运行良好。但是，在Hive shell模式下执行查询时，我会收到以下错误： hive>创建表saurzcode(id int，name string)；失败: org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException:无法实例化org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient 请告诉我

浏览 0提问于2018-05-08得票数 0

回答已采纳

3回答

在插入覆盖的分区目录下创建额外的子文件夹

我有一张按年、月、日、小时划分的桌子。如果我对特定的分区使用下面的INSERT覆盖，它会将一个文件放在适当的目录结构下。此文件包含字符串abc:- INSERT OVERWRITE TABLE testtable PARTITION(year = 2017, month = 7, day=29, hour=18) SELECT tbl.c1 FROM ( select 'abc' as c1 ) as tbl; 但是如果我使用以下语句，Hive会意外地在"hour=18“文件夹下创建三个新文件夹。这三个子文件夹中每个都有一个文件。 INSERT OVER

浏览 0提问于2016-07-30得票数 1

1回答

如何在停止上下文后强制关闭与mysql的Spark Hive metastore连接？

、、、

我使用Spark来查询配置单元，然后进行转换。我的Scala应用创建了多个Spark应用。只有在关闭前一个spark应用的SparkSession和Spark上下文后，才会创建新的Spark应用。但是，在停止sc和spark时，不知何故，与Hive Metastore (Mysql)的连接未正确销毁。对于每个，Spark App我可以看到大约5个Mysql连接被创建(旧的连接仍然活跃！)。最终，在150个打开的连接之后，Mysql开始拒绝新连接。如何强制spark关闭到Mysql的Hive metastore连接(在spark.stop()和sc.stop()之后)？注意:我使用的是Spa

浏览 23提问于2017-08-15得票数 0

3回答

将大量MySQL数据导入Hadoop

、、

我计划使用一个使用Hadoop、Hive和Impala的堆栈来分析大数据。我已经准备好了设置，现在我正在尝试从MySQL表中导入数据。表大小超过500 GB，我计划使用Sqoop，如下所示： sqoop import --connect jdbc:mysql://remote_host_ip/database_name --username user_name -P --table table_name --hive-import --compression-codec=snappy --as-parquetfile --warehouse-dir=/user/hive/warehouse -

浏览 26提问于2016-08-24得票数 1

1回答

使用Hive进行实时查询

、、、、

首先，我想澄清一下，我正在学习Hive和Hadoop (以及一般的大数据)，所以请原谅我缺乏适当的词汇。我正在着手一个巨大的项目(至少对我来说)，它需要处理大量的数据，而我过去不习惯于处理这些数据，因为我一直主要使用MySQL。对于这个项目，一系列传感器将产生大约125.000.000个数据点，每小时5次(每天15.000.000.000)，这是我插入到每个MySQL表中的所有数据点总和的数倍。我知道一种方法是使用Hadoop MapReduce和Hive来查询和分析数据。我面临的问题是，据我所知，Hive的运行方式主要类似于"cron job“，而不是实时查询，这可能需要花费

浏览 6提问于2012-10-03得票数 5

回答已采纳

1回答

在hadoop伪集群中不工作的SQL亚稳态

、、

我想在hive中执行sql查询，因此我使用SQL作为亚稳态。但是在执行过程中我得到了一个错误：- org.apache.hadoop.hive.ql.metadata.HiveException：SemanticException java.lang.RuntimeException:无法实例化org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient. 我环顾四周，却找不到解决办法。Hive正在运行，但在执行sql查询时，我会得到错误。我得到了链接的帮助。 Hive-site.xml <name>javax.

浏览 0提问于2018-06-18得票数 0

3回答

如何使用sqoop覆盖单元中的数据

、

我试图通过mysql数据库中的sqoop将数据加载到已存在的hive表中。我指的是以下指南，以供参考：- --hive-import已经成功地进行了试验和测试。我创建了一个蜂巢表如下：- create table sqoophive (id int, name string, location string) row format delimited fields terminated by '\t' lines terminated by '\n' stored as textfile; 按要求加载数据。我想使用--hive-overwrit

浏览 6提问于2016-03-28得票数 0

1回答

如何使用单元格从字符串列中提取值

、、、

我需要使用hive从字符串列中提取字段。 Input: [{"name":"MANAGER"}] Output: MANAGER 我能够使用下面的正则表达式获取记录，但无法从输出中删除]。生成的查询： select split(regexp_replace('([{"name":"MANAGER"}])','^\$|\$$|[{"}]',''),': *')[1]; 获得的产出： MANAGER] 请您帮助我从输出中删除]，并在本例中使用hive

浏览 4提问于2022-02-24得票数 1

回答已采纳

1回答

Sqoop - Syntaxt错误-边界查询-“SQL语法中的错误”

、、

我正在尝试使用Sqoop将一些数据从MYSQL加载到Hive表中。我有一些边界查询的条件。我的命令是： sqoop import --connect jdbc:mysql://localhost:3306/retail_db --username retail_dba --password cloudera --table order_items --boundary-query "SELECT 1,10 FROM order_items WHERE $CONDITIONS" --split-by order_id --hive-import --hive-home /user

浏览 1提问于2018-12-09得票数 0

回答已采纳

2回答

如何在hive(0.13.1)表中插入多行数据？

、

我正在寻找一个等同于Hive版本0.13.1的以下查询。 INSERT INTO TABLE table1 VALUES (151, 'cash', 'lunch'), (152, 'credit', 'lunch'), (153, 'cash', 'dinner'); 从 answer中可以清楚地看到"INSERT.... VALUES“查询在版本0.14之后可用。那么，对于给定配置单元版本，上述查询的等价物是什么？

浏览 65提问于2017-05-06得票数 6

回答已采纳

1回答

如何使用sqoop从mySql服务器将JSON字段数据导入Hive表

、、、

我在MySQL服务器中有一个表名MySQL，其中有两个字段EmpID (INT)和Details (nvarchar)。Details字段包含类似于JSON的字符串 { "name": "Michel","address":{"house no":"12","street":"Johnson road","city":"New Delhi","country":"INDIA"}} { "name": &

浏览 4提问于2016-07-27得票数 0

回答已采纳

2回答

在“火花-defaults.conf”中设置属性“spark.sql.hive.metastore.jars”后出现的异常

、、、

下面是我在系统中安装的Spark & Hive的版本星火：spark-1.4.0-bin-hadoop2.6 蜂巢：apache-hive-1.0.0-bin 我已经将Hive安装配置为使用MySQL作为Metastore。目标是访问MySQL Metastore &在spark-shell中执行HiveQL查询(使用HiveContext) 到目前为止，我能够通过访问Derby来执行HiveQL查询(如所描述的，相信Spark-1.4与Hive 0.13.1捆绑在一起，后者使用内部Derby数据库作为Metastore)。然后，我试图将spark-shell指向我的外部M

浏览 3提问于2015-07-17得票数 5

1回答

如何从查询跨目录表(例如，来自mysql和hive的联合表)到PrestoDB？

、

如何从查询跨目录表(例如，来自mysql和hive的联合表)到PrestoDB？在SQLAlchemy中应该输入什么URI？

浏览 2提问于2018-01-19得票数 2

回答已采纳

1回答

配置单元多个子查询和分组依据

、、、

我正在将统计数据从MySQL切换到亚马逊DynamoDB和弹性MapReduce。我有以下查询，适用于MySQL，我在hive上有相同的表，需要与MySQL上相同的结果( last_week，last_month和last_year的产品视图)。 SELECT product_id, SELECT COUNT(product_id) from dev_product_views_hive as P2 where P2.product_id=P.product_id and created >= DATE_SUB(NOW(), INTERVAL 1 WEEK) as weekly, SE

浏览 1提问于2013-03-04得票数 0

回答已采纳

1回答

HiveQL:联合表小于任一组件表

、

为什么由两个表的UNION得到的表比UNION中涉及的任何一个表都小 CREATE TABLE adb.table4 STORED AS ORC AS SELECT a.* FROM adb.table2 a UNION SELECT b.* FROM adb.table3 b; hive> SELECT COUNT(1) FROM adb.table4; 15,961,225 Time taken: 0.084 seconds, Fetched: 1 row(s) hive> SELECT COUNT(1) FROM adb.table2; 70,152,930 Time t

浏览 2提问于2017-05-24得票数 0

1回答

如何使用包含空格的标识符为列添加别名？

、

有人知道在Hive中为不带下划线的列设置别名的语法吗？在SQL和MYSQL中，您可以使用单引号或方括号。这在Hive中似乎不起作用。下面是一个不起作用的简单查询： select inbound_handled as 'IB Handled' from shdev.cust_data

浏览 4提问于2017-04-27得票数 3

2回答

蜂箱桌不见了

、

我使用Sqoop命令将数据从MySQL导入到Hive。sqoop import --connect jdbc:mysql://mysql_server/db1 --username userid --password passwd --query 'select col1, col2, sum(col3), sum(col4), sum(col5), sum(col6) from table1 WHERE $CONDITIONS group by col1, col2' --split-by col1 --hive-import --hive-home /root/dev/hi

浏览 3提问于2014-03-21得票数 1

2回答

翻译用于蜂巢的MySQL‘显示创建表’

、

使用MySQL，我可以运行一个简单的查询来获得给定表的create语句： SHOW CREATE TABLE tableA 我想将MySQL表的create语句转换为Hive的create语句。我不想导入这个表-sqoop-但是只想在Hive中重新创建它的结构。谢谢。

浏览 3提问于2014-10-22得票数 0

回答已采纳

1回答

查询远程蜂箱时的火花返回空结果

、、

当查询远程蜂箱火花时，火花返回空的结果，尝试从2.1.1触发2. 3. 2 代码片段是： import org.apache.spark.sql.SQLContext val sqlContext = new SQLContext(sc) val dataframe_mysql = sqlContext.read.format("jdbc").option("url", "jdbc:hive2://10.0.0.28:10000/default").option("driver", "org.apache.hive.jdb

浏览 5提问于2022-07-15得票数 0

2回答

SAP火花控制器不缓存数据

、

我已经让SparkController 2.0.0运行在带有Spark1.6.2的HDP 2.4.3上在配置中，我配置了以下参数： sap.hana.es.enable.cache=true sap.hana.es.cache.max.capacity=500 sap.hana.hadoop.datastore=Hive 我已经将HANA1.00.122连接到了Spark，在enable_remote_cache中将indexserver.ini参数设置为true，并在HANA中将一个公开的Hive表导入为一个虚拟表。然后，我对那个虚拟表运行select语句，但是每次我看到没有创建缓存(

浏览 3提问于2017-06-14得票数 0

回答已采纳

1回答

星火和MySQL元存储的蜂巢

、、、

我正在尝试用Hive和一个MySQL支持的元数据存储来配置Apache。我得到以下异常 Caused by: java.sql.SQLException: No suitable driver found for jdbc:mysql://<correct-information> 我能够用下面的命令启动shell bin/spark-shell --jars /usr/share/java/mysql-connector-java.jar 然后我运行以下命令 scala> Class.forName("com.mysql.jdbc.Driver") res0

浏览 0提问于2014-11-20得票数 2

回答已采纳

1回答

使用MySQL作为元存储从配置单元查询元数据

、、、、

我正在寻找一种使用HiveQL命令查询我的配置单元数据的元数据的方法。我配置了一个ODBC元存储，但必须通过HIVE命令查询元数据，因为这样我就需要通过MySQL连接到HIVE系统来访问数据。

浏览 12提问于2018-02-14得票数 1

1回答

spark查询执行时间

、、

我安装了本地hadoop单节点和配置单元，并将一些配置单元表存储在hdfs中。然后，我使用MySQL元存储区配置配置单元。现在我安装了spark，我正在对hive表进行一些查询，就像这样(在scala中)： var hiveContext = new org.apache.spark.sql.hive.HiveContext(sc) result = hiveContext.sql("SELECT * FROM USERS"); result.show 你知道如何配置spark来显示查询的执行时间吗？因为默认情况下，它不显示..

浏览 2提问于2016-04-04得票数 2

1回答

从mysql到配置单元导入sqoop所有表

、

我正在尝试使用blow sqoop查询将所有表从mysql模式导入到配置单元：- sqoop import-all-tables --connect jdbc:mysql://ip-172-31-20-247:3306/retail_db --username sqoopuser -P --hive-import --hive-import --create-hive-table -m 3 它是在说， 18/09/01 09:24:52 ERROR tool.ImportAllTablesTool: Encountered IOException running import job: org

浏览 16提问于2018-09-01得票数 0

1回答

Sqoop将mysql表中新添加的列导入到现有配置单元表中

、、

我在mysql中有表测试，如下所示： id name address 1 Km sky 2 hd heaven 3 Ab null 4 en null 现在我做了一个sqoop导入，如下所示 sqoop import--connect jdbc:mysql://XXXXXX/testing --username XXXX --password XXXX --query "select * from testing.test where \$CONDITIONS" --null-string '' --null-non-string '

浏览 23提问于2017-02-21得票数 0

回答已采纳

1回答

Spark SQL(通过HiveContext的配置单元查询)总是创建31个分区

、、

我在我的Spark代码中使用HiveContext运行hive查询。无论我运行哪个查询，以及它有多少数据，它总是生成31个分区。有人知道原因吗？是否有预定义/可配置的设置？我基本上需要更多的分区。我使用以下代码片段来执行配置单元查询： var pairedRDD = hqlContext.sql(hql).rdd.map(...) 我使用的是Spark 1.3.1 谢谢你，妮汀

浏览 3提问于2016-04-28得票数 1

3回答

Spark似乎不使用与Hive相同的仓库

、、、、

我已经开始在我的Eclipse上使用Spark 2.0，我创建了一个maven项目，并获得了所有最新的依赖项。我能够毫无问题地运行配置单元查询。我担心的是Spark为hive创建了另一个仓库，并且没有使用我想要的数据仓库。因此，我的服务器上的所有配置单元表，我无法将这些配置单元表读取到我的Spark数据集中，也无法进行任何转换。我只能创建和处理新表，但我希望在hive中读取我的表。我的hive-site.xml :- <configuration><property> <name>javax.jdo.option.ConnectionURL</n

浏览 1提问于2016-11-11得票数 1

1回答

无法启动蜂巢，Trino中不存在“蜂巢”目录

、、、、

我安装了Apache 3、Apache 3、MySQL和Trino来查询数据。我开始了蜂巢转移，我有MySQL在运行。但是当我在Trino中运行一个简单的查询时： trino> show tables from default; ==>失败:第1行:目录‘胞’不存在当我试图启动蜂巢时。我有个例外： Hive Session ID = dd740516-a5d0-4f8d-ae24-065e2cfe889c Exception in thread "main" java.lang.ClassCastException: jdk.internal.loader.Cl

浏览 7提问于2021-01-27得票数 2

回答已采纳

2回答

使用配置单元查询从Sqoop到MySQL

、、、、

我想将数据从配置单元表中sqoop到MySQL表中。两者具有相同的列集，但它们的顺序不同。有没有办法使用Hive查询将数据sqoop到mysql表中，该查询的列顺序属于mysql表？

浏览 1提问于2012-08-20得票数 1

1回答

在Mac上运行与Apache鲨鱼的查询

、、、

在MacOSX10.8上，我在本地运行Shark查询时遇到了困难。我正在尝试对存储在Hive中的数据运行一些测试查询。我正在使用Scala2.9.3和Hive0.9.0，两者似乎都运行良好。Hive数据库使用MySQL存储元数据。我可以很好的启动鲨鱼。我可以在鲨鱼控制台的蜂巢里看到我所有的数据库。我可以切换到所需的数据库。但是，当我试图查询数据时，我会得到错误。简单的查询如下所示： select * from table limit 100; 错误如下所示： 25.351: [Full GC 98320K->17564K(1013632K), 0.1279630 secs] java

浏览 2提问于2014-02-03得票数 1

回答已采纳

1回答

在单元配置上应用授权策略时出错:无法创建目录${system:java.io.tmpdir}\${hive.session.id}_resources

、、

我在windows上运行Hadoop 3.0.0-alpha1，并将Hive 2.1.1添加到其中。当我试图使用hive命令打开蜂巢时，我会得到一个错误： Error applying authorization policy on hive configuration: Couldn't create directory ${system:java.io.tmpdir}\${hive.session.id}_resources 出什么事了？我运行mysql作为Hive的亚稳态，并在HDFS中添加了所需的文件： hadoop fs -mkdir /user/hive hadoop

浏览 0提问于2017-03-09得票数 4

2回答

如何使用jdbc钩子在气流jinja模板中运行多个sql语句

、、

试图通过气流使用jdbchook和jinja模板运行hive。模板对于单个sql语句很好，但对多个语句抛出一个解析错误。达格 p1 = JdbcOperator( task_id=dag=dag+‘_create’，jdbc_conn_id='big_data_hive'，sql='/mysql_template.sql'，params={'env'：ENVIRON}，autocommit=True，dag=dag) 模板创建表{params.env}_fct.hive_test_templated (cookie_id字符串、ses

浏览 0提问于2018-04-24得票数 1

回答已采纳

1回答

钻头中的HbaseStorageHandler插件

、

我可以使用Drill.Now单独查询hive，hbase --我正在尝试查询hive中的HbaseStorageHandler类型表。为此，在演练中，我添加了以下这些特性： { "type": "hive", "enabled": true, "configProps": { "hive.metastore.uris": "thrift://trinitybdClusterM02.trinitymobility.local:9083", "javax.jdo.op

浏览 3提问于2016-11-14得票数 0

回答已采纳

1回答

未使用Sqoop进行蜂箱导入

、、

我正在尝试将mysql导入到蜂箱中，但是下面的查询没有做到这一点： sqoop import --connect jdbc:mysql://localhost/cars --username root --query 'Select carnum,carname from carsinfo where $CONDITIONS' --hive-import --hive-table exams.examresults --target-dir /hive_table1_data --m 1 我在导入时发现了错误运行导入作业的封闭IOException : java.io.IO

浏览 2提问于2016-06-23得票数 0

1回答

如何运行sqoop导入并将任务与特定的计划程序队列相关联

、

我遇到了需要运行sqoop导入并将MR作业放入特定队列的情况。我尝试了以下命令，但它不起作用。 /usr/bin/sqoop import -Dmapred.job.queue.name=scheduledjobs --用户名=hduser--密码=XXXXXXX --connect jdbc:mysql://127.0.0.1/analytics --fields-terminated-by '，‘--查询"SELECT email FROM analytics.store WHERE \$CONDITIONS“-m1 --hive-import --hive-table

浏览 0提问于2014-06-09得票数 0