腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
pyspark
sql
查询
等价
函数
python
、
apache-spark
、
pyspark
我才刚刚开始深入了解
Pyspark
。 这是一个包含大约20K行的实际数据集的示例。我在
pyspark
shell中将这个CSV文件作为数据帧读取。尝试在此数据上转换一些基本的
SQL
查询
以获得实际操作。下面是一个我不能回答的问题: 1.还有一些我自己手动创建的
查询
,我可以用
SQL
执行,但我只是被困在理解其中的一个上。如果我对此有了一个想法,它将与解决其他问题相当相关。
浏览 17
提问于2019-11-11
得票数 0
回答已采纳
2
回答
Oracle子
查询
的
Pyspark
sql
pyspark
、
pyspark-sql
、
pyspark-dataframes
如何将以下基于oracle的
sql
查询
写到
等价
的
pyspark
sql
中,因为这是不支持的,因为它嵌套在spark.
sql
(* query )下。有没有办法也用
pyspark
dataframe来写这个?
浏览 18
提问于2020-01-11
得票数 0
2
回答
pyspark
寄存器内置
函数
及其在spark.
sql
查询
中的使用
apache-spark
、
pyspark
、
apache-spark-sql
在spark.
sql
查询
中注册和使用
pyspark
version 3.1.2内置
函数
的正确方式是什么? 下面是一个创建
pyspark
DataFrame对象并在纯
SQL
中运行简单
查询
的最小示例。For column literals, use 'lit', 'array', 'struct' or 'create_map' function...的
pyspark
内置<em
浏览 4
提问于2021-08-19
得票数 0
回答已采纳
1
回答
无法在
pyspark
中导入parse_url
python
、
pyspark
、
hiveql
对于
pyspark
中的hiveql,我有以下
sql
查询
:我想翻译成
函数
式
查询
,比如:
浏览 25
提问于2019-11-07
得票数 3
回答已采纳
1
回答
pyspark
.
sql
.functions.posexplode的等效
函数
在预置中?
apache-spark
、
pyspark
、
hive
、
presto
有没有人知道,如果有一个
等价
的
函数
,类似于火花放电
函数
,
pyspark
.
sql
.functions.posexplode()在预置? 我试图用它的索引来爆炸和排列。我知道UNNEST()的存在。
浏览 17
提问于2022-11-02
得票数 1
回答已采纳
1
回答
在
pyspark
中创建列的数组
python
、
apache-spark
、
pyspark
、
apache-spark-sql
这个问题回答了如何在scala中做到这一点,但我想用
pyspark
来实现。我试着用
pyspark
复制代码,但我没能做到。我无法将scala中的以下代码转换为python:var ColumnsAndValues: Array[Column] = df.columns.flatMap
浏览 18
提问于2021-03-11
得票数 0
回答已采纳
1
回答
如何在
pyspark
dataframe中获取列的唯一值并存储为新列
python
、
pandas
、
pyspark
hpbrand_change_num')) .reset_index()),how='left',on=['msisdn']) 下面是我在
pyspark
handset_brand").count().show() 错误消息 AttributeError: 'GroupedData' object has no attribute 'select' 如何在
pyspark
浏览 76
提问于2021-08-30
得票数 0
回答已采纳
1
回答
pySpark
,聚合复
函数
(连续事件的差异)
python
、
pandas
、
apache-spark
、
pyspark
有没有办法用
pySpark
做同样的事情?
浏览 4
提问于2016-12-10
得票数 1
1
回答
如何在spark中进行嵌套collect_list?
apache-spark
、
pyspark
、
apache-spark-sql
下面是我的星星之火
sql
查询
policy.CustomerId,不允许在另一个聚合
函数
的参数中使用聚合
函数
。请在子
查询
中使用内部聚合
函数
。 from
pyspark
import SparkConf from
浏览 4
提问于2021-06-11
得票数 2
回答已采纳
1
回答
如何将udf添加到sqlContext中
python
、
apache-spark
、
user-defined-functions
我知道我可以注册一个UDFand
函数
,因为它可以在
SQL
查询
中使用: return len(s)spark.
sql
("SELECT example_udf(col) FROM data")from
pyspark
.
sql</
浏览 1
提问于2018-04-13
得票数 0
回答已采纳
2
回答
等价
于Scala Dataset#transform方法的
Pyspark
变换方法
apache-spark
、
pyspark
、
apache-spark-sql
、
apache-spark-dataset
.transform(myFirstCustomTransformation)我没有看到与transform方法
等价
的方法是否有一种链接自定义转换的
PySpark
方法?更新 变换方法为 ( )。
浏览 0
提问于2017-09-15
得票数 7
回答已采纳
2
回答
如何在SparkSQL /Scala中将Python
函数
注册为UDF?
apache-spark
、
apache-spark-sql
在Python中,我很少有非常非常简单的
函数
,我想在Spark中作为UDF使用它们。从Python注册和使用它们似乎很容易。我注意到在spark 1.2.1中有
函数
,但我不清楚如何使用它,也不清楚是否应该. 对怎么做有什么想法吗?我认为在1.3.0中可能会更容易,但我只限于1.2.1。
浏览 7
提问于2015-03-19
得票数 9
1
回答
将Python代码转换为
pyspark
环境
pandas
、
pyspark
、
group-by
、
shift
、
cumsum
在火星雨中,我怎么能拥有与熊猫的shift()和累积量()相同的功能呢? temp['transformed'] = tem
浏览 4
提问于2022-09-18
得票数 -1
回答已采纳
1
回答
spark
sql
日期间隔
sql
查询
不起作用
sql
、
apache-spark
、
pyspark
、
bigdata
、
sql-function
我提出的解决方案是一个
sql
查询
,它创建我需要的数据: dateadd(minute, datediff(minute, 0, cast ([date] + ' ' + [time我知道它可能看不到
sql
函数
,但我已经导入了:from
pyspark
.
sql
import SQLContextfrom
pyspark
.<
浏览 1
提问于2018-09-06
得票数 1
1
回答
在
pyspark
sql
中使用current_timestamp()时没有可行的替代错误
apache-spark
、
pyspark
简介 我想在执行select
查询
时添加一列作为当前时间戳,如下所示: import
pyspark
from
pyspark
.
sql
.function", 'true') \ .config("spark.
s
浏览 43
提问于2021-09-27
得票数 0
2
回答
如何在
PySpark
中根据数组值进行过滤?
python
、
apache-spark
、
dataframe
、
pyspark
、
apache-spark-sql
| |-- score: double (nullable = true)我尝试使用下面的
查询
从vendorTags中选择嵌套字段如何在
PySpark
中
查询
如下所示的我尝试了上面的
查询
,只得到了下面的错误 df3 = sqlContext.<em
浏览 0
提问于2016-03-15
得票数 16
回答已采纳
1
回答
使用regex语句的case语句
python
、
sql
、
apache-spark
、
pyspark
、
apache-spark-sql
然后,我将使用
sql
查询
在最后一个
查询
中创建一个新字段。我想要创建的字段的代码最初来自postgresql,我想知道在
pyspark
中正确版本的case语句和regex是什么?代码:from
pyspark
.context import SparkContextfrom
pyspark
.<e
浏览 1
提问于2021-04-16
得票数 0
回答已采纳
1
回答
如何使用
PySpark
JDBC连接器在Postgres上远程执行Postgres
函数
?
postgresql
、
apache-spark
、
jdbc
、
pyspark
、
apache-spark-sql
我想使用
PySpark
应用程序在远程Postgres服务器上使用执行以下
查询
问题是,我不能使用spark.
sql
(QUERY)对
Pyspark
执行这种
查询
,很明显,因为postgres_function不是ANSI
函数
。
浏览 3
提问于2016-11-25
得票数 0
回答已采纳
1
回答
在
pyspark
中实现合并到
sql
sql
、
merge
、
pyspark
、
apache-spark-sql
如何才能以有问题的方式(
pyspark
)实现
sql
MERGE INTO语句。我有两个表,我使用createOrReplaceTempView选项将它们转换为临时视图。原因可能是SPARK
SQL
不支持合并。有人能给出一个提示吗?如何在
pyspark
中以编程方式实现一个简单的MERGE INTO
SQL
等价
语句(类似下面的内容)?
浏览 0
提问于2018-08-05
得票数 8
4
回答
如何在Spark DataFrame中访问VectorUDT列的元素?
apache-spark
、
dataframe
、
pyspark
、
apache-spark-sql
、
apache-spark-ml
我试着做了以下几件事 from
pyspark
.
sql
.functions import udfdf.select
浏览 122
提问于2016-09-18
得票数 23
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券