社区首页 >问答首页 >将变量传递给pyspark sql中的配置单元查询

将变量传递给pyspark sql中的配置单元查询
EN

Stack Overflow用户
提问于 2021-09-17 01:48:23
回答 1查看 121关注 0票数 0

我正在尝试使用spark sql对hive表执行查询。

下面的代码运行良好

代码语言:javascript
代码运行次数:0
复制
spark=SparkSession.builder.master("local[1]".enableHiveSupport().appName("test").getOrCreate()
df=spark.sql("select * from table_name where date='2021-05-16' and name='xxxx'")

但我希望将日期和名称作为变量传递,而不是将其硬编码到SQL中。

有没有一种方法可以传递date=current_date而不是对值进行硬编码

我试图将当前日期作为日期传递给使用time.strftime和name的查询,我必须从另一个变量name='xxxx‘传递它。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-09-17 01:57:41

您可以从py文件外部传递变量吗?

如果是,你可以试试这个

代码语言:javascript
代码运行次数:0
复制
import sys
day = sys.argv[1]
df=spark.sql("select * from table_name where date='%s'" % day)
代码语言:javascript
代码运行次数:0
复制
spark-submit --master yarn test.py 2021-09-17
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69221275

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档