如何在使用pyspark时访问hive表中的注释？_如何在EMR中通过spark授予Jupyterhub访问hive表的权限_如何在pyspark中高效地将大型.tsv文件上传到拆分列的Hive表中？ - 腾讯云开发者社区

、、

我已经设置了一个hive datamart，并使用spark框架来查询表和执行ETL活动，现在我希望用户通过从他们的本地机器连接来访问蜂箱表，并且查询应该使用spark框架。

浏览 1提问于2019-04-11得票数 0

回答已采纳

2回答

如何在使用pyspark时访问hive表中的注释？

、

当我使用pyspark连接到hive时，我想获取表的注释，我使用了"DESCRIBE table table_name"，但它不起作用 .option("password", "password") \

浏览 38提问于2019-07-16得票数 0

1回答

无法通过PySpark访问配置单元

、、、

我是Hadoop/Spark/Hive的新手！我已经创建了一个本地运行的单节点linux (Ubuntu 18.04.1 LTS) VM；Hadoop 3.1.0；Spark: Spark 2.3.1，Hive: Hive-3.0.0 我的Hive使用标准的Derby DB，我可以通过终端访问hive并创建数据库、表，然后很好地查询这些表。<e

浏览 0提问于2018-10-04得票数 1

1回答

Pyspark:在远程Hive Server中选择数据

、、、

尝试读取和写入存储在远程Hive Server中的数据。我遵循这个例子：from pyspark.sql"spark.sql.warehouse.dir", warehouse_location) \ .getOrCreate() 示例演示如何在</

浏览 0提问于2017-09-04得票数 0

回答已采纳

2回答

我刚开始读“星火”和“O‘’Reilly”这本书，所以希望我的问题是有意义的。看起来，在应用程序运行完之后，数据库和托管表将持久化。但是，如果我编写了一个试图访问托管表的单独应用程序，则会得到一个“表不存在”错误。在编写应用程序时，一旦您完成了对表和数据库的处理以保持“干净”，那么删除它们是否是一种好的做法呢？有什么方法可以清理外部表'learn_spark_db.managed_flights_tbl‘

浏览 2提问于2021-12-01得票数 0

5回答

火花放电查询蜂箱表

、

我正在使用CDH5.5hive> use default; Time taken: 0.341: 1 row(s) 但是，由于表无法识别表，所以我无法从pyspark查询该表。from <em

浏览 14提问于2016-03-17得票数 35

1回答

Spark SQL无法访问火花服务器

、、、

我无法配置Spark以使我能够访问中的Hive表(不使用JDBC，而是从Spark本地访问)我在启用了./

浏览 0提问于2019-01-14得票数 0

1回答

pyspqrk sql配置单元表中存在错误数据

、、、、

我正在尝试使用Pyspark中包含25亿条记录的Hive表。我假设表中有一些格式错误的或其他“坏”数据。我使用的是spark版本1.6.2和python版本2.6.6：from pyspark.sql import从Hive CLI访问整个表</em

浏览 1提问于2017-01-28得票数 1

4回答

将火花数据存储到蜂巢中:表格不可读，因为“SequenceFile不是块”

、、、

我希望使用PySpark将数据保存到一个Hive表中。指出： from pyspark.sql import HiveContext sqlContext = H

浏览 2提问于2015-07-17得票数 9

回答已采纳

1回答

用列列表激发SQL插入选择？

当我阅读Spark/Hive文档时，将插入到带有列列表的表中，在Spark2.4和更早版本中不支持。insert into outpu

浏览 1提问于2019-01-09得票数 4

回答已采纳

1回答

SparkSql从配置单元表中获取浮点类型字段值null

、、

我使用sqoop创建和导入hive表，并使用pyspark获取数据。该表由一个字符串字段、一个整型字段和多个浮点型字段组成。我可以通过hue hive sql查询获得整个数据。但是，当我使用pyspark sql编程时，可以显示非浮点型字段，而浮点型字段总是显示空值。色调配置单元sql结果： zeppelin pyspark输出： hive表的

浏览 18提问于2017-06-29得票数 0

3回答

火花弹出蜂箱表

、

我想把一张蜂箱的桌子扔到火花里去。在一个包含Hadoop2.6、Hive2.0、Spark1.6和Spark2.0的集群中。我尝试了下面的代码，在火花公子外壳和火花提交作业与这两个版本。但是，如果代码位于python文件中，然后使用submit提交到集群中，那么代码就不会生效。怎样才是正确的方法，把一个蜂箱表通过火花？在使用上述代码提交的作业中。我发现的一个解决

浏览 5提问于2016-09-30得票数 8

1回答

皮斯卡尔:远程蜂巢仓库位置

、、、、

我需要读/写存储在远程Hive中的表。我只知道这个远程蜂巢是在码头下运行的。在讨论如何访问Hive表时，Pyspark教程写道：在使用Hive时，必须使用Hive支持实例化SparkSession，包括连接到持久的Hive转移、支持Hive serdes和<e

浏览 3提问于2017-09-05得票数 2

4回答

火花可以从火星雨访问蜂巢表，但不能从火花提交。

、、、

因此，当从pyspark运行时，我会输入(没有指定任何上下文)：spark-submit script.py --我将以下内容放入frompyspark import SparkConf, SparkContext conf

浏览 2提问于2016-04-01得票数 18

回答已采纳

1回答

使用Pyspark读取拼图和ORC HDFS文件

我用"Org.apache.hadoop.hive.ql.io.parquet.serde.MapredParquetInputFormat“格式创建了我的配置单元外部表，输出格式："Org.apache.hadoop.hive.ql.io.parquet.serde.MapredParquetOutputFormat如何使用Pyspark从hdfs读取这些配置单元表文件？

浏览 35提问于2021-07-09得票数 0

1回答

在路径中具有特殊字符的星火sql加载parqet

、、

我正在使用pyspark将文件加载到下面的表中 pyspark.sql.utils.AnalysisException:当路径字符串在目录结构(如XX/XX/2021-03-02T20:04:27+00:

浏览 1提问于2021-04-23得票数 0

2回答

PySpark/HIVE:追加到现有表中

、、、

真正基本的问题pyspark/hive问题：from pyspark import SparkContext, SparkConfconf_init = SparkConf().setAppName('pyspark2')<

浏览 0提问于2017-11-30得票数 2

回答已采纳

1回答

如何使火花放电和SparkSQL在星火上执行蜂巢？

、、、、

通过使用spark-shell / pyspark，我还遵循并实现了创建Hive表，加载数据，然后正确选择。目前我还无法完成的步骤是将<em

浏览 0提问于2020-02-23得票数 0

回答已采纳

2回答

Python Spark查询配置单元仅返回架构

、、、、

当我从Hive中选择data时，它会返回一个dataframe，但我不能访问模式以外的任何内容。")data.show()<class 'pyspark.sql.dataframe.DataFrame'> 如果我试图显示数据帧，它会返回一个引用

浏览 1提问于2018-04-19得票数 0

1回答

Hadoop 3和spark.sql:同时使用HiveWarehouseSession和spark.sql

、、、、

在此之前，我可以完全在spark.sql api中工作，以便与蜂巢表和火花数据帧进行交互。我可以查询使用同一个api注册的spark或hive表中的视图。我想确认一下，用Hadoop3.1和pyspark 2.3.2已经不可能了？要对蜂窝表执行任何操作，必须使用“HiveWarehouseSession”api，而不是spark.sql api。，您可以使用JDBC风格的<

浏览 0提问于2019-08-29得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何从Apache访问Hive表？

如何在使用pyspark时访问hive表中的注释？

无法通过PySpark访问配置单元

Pyspark:在远程Hive Server中选择数据

Spark数据库和托管表是否持久？

火花放电查询蜂箱表

Spark SQL无法访问火花服务器

pyspqrk sql配置单元表中存在错误数据

将火花数据存储到蜂巢中:表格不可读，因为“SequenceFile不是块”

用列列表激发SQL插入选择？

SparkSql从配置单元表中获取浮点类型字段值null

火花弹出蜂箱表

皮斯卡尔:远程蜂巢仓库位置

火花可以从火星雨访问蜂巢表，但不能从火花提交。

使用Pyspark读取拼图和ORC HDFS文件

在路径中具有特殊字符的星火sql加载parqet

PySpark/HIVE:追加到现有表中

如何使火花放电和SparkSQL在星火上执行蜂巢？

Python Spark查询配置单元仅返回架构

Hadoop 3和spark.sql:同时使用HiveWarehouseSession和spark.sql

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐