腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
AssertionError: col应该是
列
、
、
、
如
何在
PySpark
中
创建
一个新
列
并用今天的日期填充该
列
?= datetime.datetime.now()我知道这个错误: AssertionError: col应该是
列
浏览 4
提问于2017-12-20
得票数 30
回答已采纳
1
回答
PySpark
:如
何在
PySpark
SQL
中
创建
计算
列
?
、
、
使用
PySpark
SQL
并给定3
列
,我想
创建
一个额外的
列
,该
列
将其中的两
列
分开,第三
列
是ID
列
。|+----+----+----+---------------------+ 为此,我
创建
了一个udf_createDivision(df['X'], df['Y']) df = df.withCo
浏览 27
提问于2019-05-10
得票数 3
回答已采纳
1
回答
数据库
中
的枢轴问题
、
dataframe表:00 Russian Digestion;Destillation 我想在python
中
的中将兴趣
列
命名为新
列
浏览 2
提问于2022-10-17
得票数 0
2
回答
要Py的
SQL
查询(Spark)
、
、
、
、
我有以下
SQL
查询,我想将其转换为
pyspark
。我想使用两个
列
pp和gender,并在
pyspark
中
执行以下操作 %
sql
, SUM(CASE WHEN Gender = 'M'count(1) AS totalWHERE gender in ('M', 'F')HAVING count(1) > 100 我试过了
浏览 12
提问于2020-12-16
得票数 0
2
回答
Spark zeppelin:如
何在
%
pyspark
解释器
中
获取%
sql
结果?
、
、
、
我知道我可以用 %
pyspark
select C.name, count(C.name) from orderitems as A left join clientpagemodules as C on移到df = sqlConte
浏览 30
提问于2019-02-15
得票数 0
2
回答
在我的Linux终端上运行一个脚本来初始化
PySpark
外壳(SparkVersion2.4.4)
、
、
、
、
我在我的Linux
计算
机上使用
PySpark
。我的火花版本是2.4.4。sqlContext = SQLContext(sc) ( a)在我
浏览 2
提问于2019-10-18
得票数 0
回答已采纳
1
回答
包含select where的
pyspark
新
列
、
、
、
我需要在我的数据框
中
创建
两个额外的
列
,它们基于一个
列
的
计算
,该
计算
涉及一个
列
与另一个列上的条件相除。我有一个
SQL
转换的工作示例,但需要用
pyspark
equvilent重写它,并且无法正确完成。EUR| 11.2|+--------+-------+ df.createOrReplaceTempView("tempdf") 以上就是我到目前为止在
pyspar
浏览 29
提问于2021-04-26
得票数 1
回答已采纳
1
回答
火花窗函数
我试图根据某一
列
计算
数据集上的row_number,但我得到了以下错误:AttributeError: 'module' object has no attribute 'rowNumber'from
pyspark
.
sql
.types import *from
p
浏览 1
提问于2018-05-26
得票数 3
回答已采纳
1
回答
如何除以星火DataFrame
中
列
的和
、
、
如
何在
不立即触发
计算
的情况下,高效地将
列
除以其在星火DataFrame
中
的自身和?假设我们有一些数据:from
pyspark
.
sql
import SparkSession, Windowdata2 # --> DataFrame[id: bigint, norma
浏览 0
提问于2018-01-31
得票数 2
回答已采纳
1
回答
使用套接字的火花结构化流,设置模式,在控制台中显示DATAFRAME
、
、
、
如
何在
DataFrame
中
为流
PySpark
设置架构。from
pyspark
.
sql
import SparkSessionfrom
pyspark
.
sql
.functionsimport splitfrom
pyspark
.
sql
.types import * spa
浏览 3
提问于2016-12-29
得票数 3
回答已采纳
2
回答
对dataframe的
列
应用map函数
、
、
、
我需要将数据帧的所有
列
的值合并为每个
列
的单个值。所以
列
保持不变,但我只是对所有相应的值求和。我现在正在考虑做这样的事情: data = data.map(lambda current_col: sum_col(data, current_col)) 这是可行的吗,或者我需要另一种方法来合并所有
列
的值
浏览 13
提问于2020-07-01
得票数 3
回答已采纳
1
回答
具有列表数据类型的
列
: Spark HiveContext
、
、
下面的代码聚合并
创建
一个数据类型为list的
列
: "column_name_1" expr("collect_list(column_name_2) " ) 因此,似乎可以将“list”作为dataframe
中
的
列
数据类型。
浏览 2
提问于2016-07-15
得票数 0
1
回答
将向量
列
添加到吡咯DataFrame
中
、
、
、
如何将Vectors.dense
列
添加到
pyspark
中
?import pandas as pdfrom
pyspark
.
sql
import SQLContextsdf.withColumn("features", DenseVector(1)) 给出anaconda3
浏览 1
提问于2018-04-14
得票数 1
回答已采纳
4
回答
Python导入语法:我不认识这个(“它错了.”)
、
PySpark
的文档在示例
中
包括以下内容:from
pyspark
.
sql
.functions import *from datetime import date, timedelta, datetime 我不认识或理解最后两行的语法。我知道导入路径
中
的.和.. (“相对导入路径”),但是这个语法对我来说是
浏览 5
提问于2022-06-15
得票数 0
回答已采纳
2
回答
Pyspark
-使用dataframe
中
其他两个
列
的RMSE
创建
新
列
、
我对
Pyspark
还是个新手。我有一个数据框架,我想用col1和col2之间的均方根
计算
创建
第三
列
。我使用了一个用户定义的lambda函数来
计算
均方根值,但是一直收到这个错误AttributeError: 'int' object has no attribute 'mean' from
pyspark
.
sql
.functionsimport udf,col from
pyspark
.
sql
.t
浏览 39
提问于2020-04-11
得票数 0
回答已采纳
2
回答
如何使用
pyspark
python从文本文件
中
删除重复的数字
、
、
我正在尝试使用python从文本文件
中
删除重复的数字,但该操作仅适用于行。例如,我的文本文件是:66 9 23 import
pyspark
from
pyspark
import SparkContext, SparkConf
浏览 2
提问于2022-02-14
得票数 0
回答已采纳
1
回答
在
pyspark
中
计算
列
之间的方差
、
、
如何
计算
pyspark
中
多个
列
的方差?例如,如果
pyspark
.
sql
.dataframe表是:1 12 15 73 56 25 251 12 15 7 10.93 56 25 25 213.6
pyspark
中有一个方差函数,但它只
浏览 1
提问于2017-04-28
得票数 1
3
回答
Scala API
中
函数"typedLit“的
PySpark
等效项
、
、
、
我们在中有一个函数typedLit来添加数组或映射作为
列
值。import org.apache.spark.
sql
.functions.typedLit+---+---+---------+|2 |3 |[1, 2, 3]|我在
PySpark
中
找
浏览 1
提问于2020-05-31
得票数 7
3
回答
上个星期一去火场
、
、
、
我有一个带有DateType()类型
列
的dataframe。我想在dataframe
中
添加一个
列
,其中包含最近的星期一。我可以这样做:
pyspark
.
sql
.types.StructField('AccountCreationDate',
pyspark
.
sql
.types.DateType(), True),
浏览 7
提问于2016-10-26
得票数 10
回答已采纳
1
回答
如
何在
pyspark
中
获得距离?
、
、
、
、
.|2020-01-01 17:10:24| """+--------------------+--
浏览 37
提问于2020-03-28
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券