Spark SQL -在SQl笔记本中声明和使用变量_如何在SQL中声明和使用变量_在sql函数中声明变量 - 腾讯云开发者社区

apache-spark

在Azure data bricks中，我创建了SQL笔记。我正在尝试使用变量，并在多个SQL语句中使用它。例如，声明财政年度，并在where标准中使用。意图是避免硬编码。看起来我不得不使用Python / Scala。有什么方法可以使用纯SQL语句来实现这一点吗？

浏览 23提问于2019-01-27得票数 2

2回答

如何在dsx中使用Scala2.11 with Spark 2.0笔记本的"display“功能

dsx、data-science-experience、pixiedust

在dsx中，有一种方法可以在Scala2.11和Spark 2.0笔记本中使用"display“(我知道可以在python笔记本中使用pixiedust)。例如： WHEREs

浏览 3提问于2017-01-28得票数 3

2回答

在MLflow项目中通过Spark访问数据库中的三角洲湖表

apache-spark、pyspark、databricks、delta-lake、mlflow

我目前正在访问从数据库笔记本使用火花的deltalake表。但是，现在我需要从MLflow项目访问增量表。MLflow火花api只允许记录和加载SparkML模型。知道我怎么能做到这一点吗？目前，我正试图通过MLflow项目中的以下代码访问spark：if spark is None: # NB: If there is no existing Spark

浏览 8提问于2022-02-05得票数 1

2回答

散列md5: Pyspark和submit在时间戳列上不提供相同的输出

apache-spark、pyspark、hash

在PySpark中，我使用md5函数散列一些数据格式。df_hive = spark.sql("select * from db.table1 where day=1") df_hivedf_hive.withColumn("hash_col&qu

浏览 2提问于2021-04-26得票数 1

回答已采纳

2回答

根据条件执行%sql命令的Databricks python记事本

databricks

我在Databricks中创建了一个python笔记本，我有python逻辑，需要执行%sql命令。假设我想基于python变量执行commandlet2EXECUTE_SQL= Trueif condition : %sql .....

浏览 2提问于2022-08-05得票数 0

回答已采纳

1回答

如何从数据库中SQL语句的输出中创建变量

python、pyspark、databricks

我想创建一个变量，稍后我可以在同一个笔记本中的多个sql查询中使用该变量。变量本身只是sql语句的整数输出，如：然后，在后续的sql命令单元格中，我只需在计算中调用变量，如：select (count(cars) / $variable) as

浏览 2提问于2021-09-24得票数 0

2回答

如何在火花外壳中注册Java SPark UDF？

java、scala、apache-spark、user-defined-functions

下面是我的java udf代码， return false; return true;}我在单元中有一个表名作为示例，并希望在shell上运行在sql下面。火花壳--jars SparkUdf-1.

浏览 2提问于2019-02-19得票数 1

1回答

Spark -如何在pyspark中设置SQL查询的变量，并将其用于进一步的sql查询？

apache-spark、pyspark

重要的注意事项-我们必须使用set来读取RDS视图，而不是RDS表。所以需要根据这个答案SELECT * FROM db.rds

浏览 1提问于2022-07-21得票数 0

1回答

Pyspark Shell中的HiveMetaStore错误，但Jupyter Notebook中没有

python、hive、pyspark、pyspark-sql

当我尝试使用pyspark dataframe或sql时，我遇到了一件奇怪的事情。当它在ipython笔记本或python控制台中工作时，当我在pyspark shell中运行它时，我得到了"javax.jdo.JDOFatalInternalException: Error creating简而言之，如果我在iPython笔记本或简单的python终端中运行以下命令，一切都会正常工作： import findspark findspark.

浏览 35提问于2019-05-13得票数 0

回答已采纳

1回答

从另一个类访问spark

scala、apache-spark、apache-spark-sql

我创建了一个类，其中包含一个处理spark数据帧的函数。(name, year, isbn_publisher), } 问题是我不知道如何在不创建新的spark = sparksession.builder().appname("isbnencoder").master("local").getorcrea

浏览 17提问于2021-04-19得票数 0

4回答

Spark sql中的变量

apache-spark、apache-spark-sql、databricks

因为在SQL Server中，我们可以像declare @sparksql='<any query/value/string>'一样声明变量，但是在spark sql中可以使用什么替代方法。

浏览 541提问于2020-11-26得票数 3

1回答

如何在可以从另一个笔记本中访问但在同一集群中访问的databricks中注册数据？

apache-spark、pyspark、apache-spark-sql、databricks

如何在可以从另一个笔记本中访问但在同一集群中的databricks中注册数据表？**我们试图使用spark.sql在databricks中注册表，但是我们无法在另一个笔记本中访问该表*

浏览 0提问于2019-11-15得票数 0

回答已采纳

1回答

防止火花放电使用内存会话/停靠器

pyspark

我们正在调查使用星火作为大数据处理框架，在Azure Synapse分析与笔记本电脑。安装我使用WSL和Ubuntu发行版(在linux中似乎更容易管理)用于笔记本，我使用jupyter笔记本和Anaconda .appName("Python <em

浏览 2提问于2022-07-31得票数 0

回答已采纳

1回答

如何将变量从EMR集群传递到木星笔记本%%本地实例？

python、amazon-web-services、jupyter-notebook、jupyter、amazon-emr

当我使用%%local在托管木星笔记本实例上运行代码时，如何使用EMR集群的Python实例中定义的变量示例： ln[1]: p

浏览 0提问于2019-10-22得票数 1

回答已采纳

1回答

Pyspark -希望将SQL查询应用于pyspark数据帧

pyspark、amazon-emr

免责声明:我对pyspark非常陌生，这个问题可能不合适。我在网上看到了以下代码： # Get the id, age where age = 22 in SQLtemp = spark<

浏览 30提问于2020-06-17得票数 1

2回答

Spark DataFrames: registerTempTable与not

apache-spark、dataframe

我昨天才开始使用DataFrame，到目前为止我真的很喜欢它。在本例中，dataframe被注册为一个表(我猜是为了提供对SQL查询的访问。)所以问题是..什么时候您希望将数据帧注册为表，而不是仅使用给定的数据帧函数？其中一种选择比另一种更有效吗？

浏览 0提问于2015-06-19得票数 36

回答已采纳

1回答

如何在jupyter笔记本中使用pyspark时指定驱动程序类路径？

python、apache-spark、pyspark、jupyter-notebook

我想在jupyter笔记本中查询一个PostgreSQL。我在StackOverflow上浏览了很多问题，但这些问题对我都没有用，主要是因为答案似乎过时了。下面是我的最低代码：spark = SparkSession.builder.getOrCreate()

浏览 0提问于2018-08-09得票数 9

回答已采纳

1回答

在mssparkutil.notebook.run之后调用引用函数？

python、pyspark、azure-synapse、spark-notebook

在使用mssparkutils.notebook.run()运行笔记本之后，如何调用不同的Synapse笔记本中定义的函数#parametersfrom notebookutilsdefined in 'function definitions' notebook我可以使用</

浏览 12提问于2022-07-07得票数 0

回答已采纳

3回答

如何使用火花与python或jupyter笔记本

python、windows、apache-spark、pyspark、distributed-computing

我正试图在python中使用12 SO的数据，为此我迫切需要使用Spark，但我想我太蠢了，不能单独使用命令行或使用internet，这就是为什么我不得不这样做的原因，Python还提供了Python。若要在Python解释器中交互地

浏览 6提问于2016-08-22得票数 3

2回答

数据库笔记本+ Repos火花会话范围界定故障

pyspark、databricks、azure-databricks

我正在使用databricks，我有一个repo，其中我有一个基本的python模块，在其中我定义了一个类。我能够从databricks笔记本中导入和访问这个类及其方法。模块中类中的一个方法如下(简化) self.df = spark.read.format("json").load(f"{self.base_savepath}/{self.resource}/{s

浏览 3提问于2022-07-21得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云