腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我
遇到
Pyspark
错误
:
列
不可
迭代
、
当我尝试在spark中运行以下代码时,
我
得到了
错误
: 下面是回溯: TypeError Traceback (most recent callm_wbb, m_wwbb' /opt/ibm/spark/python/
pyspark
浏览 24
提问于2020-04-02
得票数 0
回答已采纳
1
回答
get_json_obj _fails for SelectExpr(),但适用于火花中的选择
、
、
、
我
面临着一个奇怪的问题,
我
试图显示
我
的JSON对象的值,它在select()中运行得很好,但是它不适用于selectExp(),
我
得到了一个奇怪的
错误
,在
我
的实现中,from
pyspark
.sql.functions import * sparkget_json_object(col
浏览 0
提问于2020-07-09
得票数 0
3
回答
pyspark
列
不可
迭代
、
当我尝试groupBy并获取最大值时,有了这个数据帧I正在获取
列
是
不可
迭代
的:+---+-----++---+-----+ 68 print "linesWithSparkGDF" /usr/hdp/current/spark-client/python/
pyspark
浏览 4
提问于2016-04-29
得票数 23
回答已采纳
1
回答
PySpark
:
列
不可
迭代
、
、
、
、
我
有以下的火花数据:+---------------+-----------------+-----------+------+df = (df.filter("module_name = &
浏览 3
提问于2022-09-06
得票数 1
1
回答
PySpark
基于
列
的vlaue添加月份到日期字段
、
、
、
、
我
有一个带有日期
列
和整数列的dataframe,
我
想根据整数列将月份添加到date
列
中。
我
尝试了以下方法,但是
我
得到了一个
错误
:withColumn('future', f.add_months('cohort', col('period'))) 其中'cohort‘是
我
的date<em
浏览 2
提问于2022-02-08
得票数 0
回答已采纳
1
回答
如何(动态)使用结构连接数组,以便从结构中获得数组中每个元素的值?
、
、
、
、
我
试图解析/扁平包含数组和结构的JSON数据。对于"data_array“
列
中的每个"Id”,
我
需要从"data_struct“
列
中获取"EstValue”。"尽
我
最大的努力使用一个动态连接,但得到
错误
“
列
是
不可
迭代
的”。我们不能像在
PySpark
中那样使用动态连接条件吗?有什么更好的方法来实现这一点吗?
PySpark
代码: from <e
浏览 1
提问于2022-10-18
得票数 1
回答已采纳
1
回答
从另一个导入的笔记本调用函数时出现的“
列
不可
迭代
”
错误
、
、
在notebook1中def add_ingest_date(input_df):final_df = add_ingest_date(input_df)
我
得到“
列
不可
迭代
”
错误
。
浏览 2
提问于2021-09-30
得票数 0
回答已采纳
1
回答
Pyspark
和Python -
列
不可
迭代
。
、
、
我
使用Python-3和Azure数据砖。
我
想找到文本'vmedwifi/‘和
列
'BodyJson’的起始位置-所有的
列
都在同一个数据帧中。
我
的密码在下面。
我
得到了第二行代
浏览 1
提问于2021-07-30
得票数 0
回答已采纳
1
回答
列
在
pySpark
中
不可
迭代
、
、
、
orderBy(hashtags_24.created_at_int).rangeBetween(-3600, 3600)#sum_count_over_time = sum(hashtags_24.ht_count).over(hashtags_24_winspec)Column is notiterable File "/usr/hdp/current
浏览 1
提问于2017-03-13
得票数 2
回答已采纳
1
回答
如何将子字符串和instr结合使用
、
、
我
试图同时使用子字符串和instr函数来提取子字符串,但无法这样做。
我
试着使用
pyspark
本机函数和udf,但得到了一个
错误
,即“
列
不可
迭代
”。你能帮帮我吗from
pyspark
.sql.functions import UserDefinedFunction data = [
浏览 7
提问于2019-12-08
得票数 1
回答已采纳
1
回答
如何
迭代
大型
Pyspark
Dataframe中
列
的不同值?.distinct().collect()引发大型任务警告
、
我
正在尝试
迭代
一个大型
Pyspark
Dataframe
列
中的所有不同值。当我尝试使用.distinct().collect()执行此操作时,即使只有两个不同的值,它也会发出“任务太大”警告。下面是一些示例代码: spark = SparkSession.builder.appName('Basics').getOrCreatelength)], ['a', 'b', &
浏览 1
提问于2020-01-14
得票数 1
2
回答
从
PySpark
DataFrame
列
中删除元素
我
知道
PySpark
DataFrames是
不可
变的,所以我想创建一个新
列
,该
列
是根据应用到
PySpark
DataFrame的现有
列
的转换生成的。
我
的数据太大了,无法使用collect()。
我
想要生成一个
列
,它遍历ints列表并为每个循环删除一个元素。要删除的元素将从所有列表中的唯一元素集合中删除,在本例中为[1,2,3]。因此,对于第一次
迭代
:[][2,3]
浏览 9
提问于2017-01-12
得票数 1
回答已采纳
1
回答
修改
PySpark
DataFrame的Pandas代码
、
、
我
有下面的代码片段,用于创建一个图形。
我
想修改它以在
PySpark
中工作,但不知道如何继续。问题是
我
不能
迭代
PySpark
中的一个
列
,并且
我
已经尝试将它变成一个函数,但没有成功。上下文: DataFrame有一个名为City的
列
,它只是作为字符串的城市名称
浏览 2
提问于2016-12-12
得票数 0
回答已采纳
1
回答
迭代
两个数据,比较和更改熊猫或火星雨中的值。
、
、
我
正试着在熊猫里做运动。Article Origin Colour Dress ItalyRed
我
希望检查文章、国家/产地和颜色
列
是否匹配(所以请检查是否可以在dataframe 2中找到dat
浏览 3
提问于2019-09-23
得票数 0
回答已采纳
2
回答
迭代
以获取子字符串
、
、
、
我
正在尝试
迭代
pyspark
数据帧,并获取某个位置后的值。数据将如下所示: ?
我
需要每一行中.和(空格)之间的值。例如,对于SNO=1,
我
需要1。
我
试着写了下面的代码,结果显示
列
不可
迭代
df3 = df2.withColumn("value", substring(df2.ColumnValue,instr(df2.ColumnValue, '
浏览 13
提问于2021-11-01
得票数 0
1
回答
.agg(计数([col列表))
、
、
我
怎样才能做到这一点?from
pyspark
.sql import functions as Ffrom
pyspark
.sql.sessionSparkContext('local')grouped=df.groupby([col list]).agg(F.count([col list]))
我
读过关于堆栈溢出的类似问题即使
我
试
浏览 3
提问于2020-02-26
得票数 0
回答已采纳
1
回答
isCheckPointed()为false
、
、
当我
迭代
地将500多个
列
添加到我的
pyspark
中时,
我
遇到
了堆栈溢出
错误
。所以我包括了检查点。检查站帮不上忙。因此,
我
创建了下面的玩具应用程序来测试
我
的检查点是否正常工作。在这个例子中,
我
所做的就是一次又一次地复制原始
列
来
迭代
地创建
列
。
我
坚持,检查点和计数每10个
迭代
。
我
注意到我的dataframe.rdd.isCheckpo
浏览 1
提问于2017-11-16
得票数 1
回答已采纳
1
回答
TypeError:'Column‘对象是
不可
调用的--使用窗口函数
、
、
#尝试在
PySpark
中使用窗口函数Join_transaciones3df.withColumn("row_num", F.row_number().
浏览 10
提问于2022-11-14
得票数 0
2
回答
函数来
迭代
每个唯一的
列
,并使用
pyspark
进行转换。
、
我
正在用
Pyspark
构建以下全局函数,以遍历CSV中以不同格式显示的每一
列
,并将它们转换为一种由“-”分隔的唯一格式。
我
对蟒蛇世界很陌生,
我
正在接受employeesDF =正在从本地sys读取csv文件def colrename(df): for col
浏览 3
提问于2022-04-28
得票数 0
1
回答
为什么
我
不应该在Python转换中使用collect()?
、
TL;DR:
我
听说某些
PySpark
函数在转换中是
不可
取的,但是
我
不知道哪些函数是
错误
的,它们为什么是
错误
的? 为什么
我
不能只在某些情况下将数据collect()到一个列表中,并对行进行
迭代
呢?
浏览 6
提问于2020-09-25
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券