为什么在尝试窗口函数时pyspark抛出"'Column‘object is not callable“？

文章/答案/技术大牛

发布

1回答

版本标签:emr-5.24.0 Hadoop发行版:Amazon 2.8.5应用程序:Spark 2.4.2，Hive 2.3.4 我正在尝试获取每年不同模型的计数，并使该计数显示为每个记录的单独列。dummy_df.py", line 39, in <module>TypeError: 'Column' object is not callable

浏览 575提问于2019-07-01得票数 0

2回答

pyspark withColumn，如何改变列名

、、

有没有办法用pyspark 2.1.0创建/填充列，其中列的名称是另一个列的值？我尝试了以下几种方法 """ df = dataFrame.withColumn('x', f.col(targetColName))out注释行不起作用，当调用该

浏览 0提问于2018-09-13得票数 1

1回答

JavaPackage对象不可调用错误: Pyspark

、、、、

像dataframe.show()、sQLContext.read.json这样的操作运行得很好，但大多数函数都会给出"JavaPackage object is not callable error“例句:当我这样做时我得到一个错误 File "/tmp/spark-cd423f35/sql/functions.py", l

浏览 0提问于2016-05-11得票数 2

回答已采纳

1回答

HiveContext createDataFrame不工作于pySpark (jupyter)

、、、、

我正在使用木星笔记本对pySpark进行分析。我的代码最初使用SQLContext(sc)，= sqlContext构建数据格式，但现在我切换到了HiveContext，因为我将使用窗口函数。我的问题是，现在我在尝试创建dataframe时得到了一个Java错误：from pyspark.sql import SQLContext fromfield_name, StringType(), True) for fi

浏览 3提问于2016-07-13得票数 3

回答已采纳

1回答

在Pyspark中使用具有多个参数的Scala UDF

、、、

以下是我到目前为止在Scala和Pyspark中所能做的事情：class SparkUDFTest() extends Serializable {}Scala主类：def testStringLength(colValue,

浏览 1提问于2018-02-12得票数 2

2回答

使用MLLIB的pyspark数据帧中的点积

、、、

我在pyspark中有一个非常简单的dataframe，类似于： from pyspark.sql import Row from pyspark.mllib.linalg import DenseVectorspark MLLIB documentation引用了DenseVectors上的dot方法，但如果我尝试按如下方式应用它： df_offers = df_offers.withColumn("c",col("a").dot(col("b"

浏览 17提问于2019-05-02得票数 1

1回答

“‘Column”对象不可调用

、、、、

当在Spark Dataframe上的过滤器中使用"and“子句时，它返回Spark.SQL.Column而不是Spark Dataframe。但在一个条件下，它工作得很好。尝试show()函数时抛出错误- 'Column' object not callable. 或者如何将Spark.SQL.Column转换为Spark Dataframe？

浏览 1提问于2019-04-23得票数 0

2回答

预览火花放电外壳中的列

、、

我有一个pyspark.sql.column.Column类型的对象pyspark.sql.column.Column，当我执行a.show()时，我得到了TypeError: 'Column' objectis not callable。想知道是否有类似于熊猫功能的火花放电，这样我就可以在将列转换为pyspark之后使用show()。1| |002564771

浏览 0提问于2018-03-09得票数 0

回答已采纳

1回答

函数火花中“列”对象的行为

、

要点是，当在函数‘DataFrame’中使用sentenceDF 'sentenceDF‘时，我会得到以下错误’列‘对象不可调用’。from pyspark.sql.functions import regexp_replace, trim, col, lower ----------------------------------------

浏览 1提问于2016-10-30得票数 0

回答已采纳

1回答

xgboost模型getfscore：“”str“”对象不可调用

、、

feat_imp = pd.Series(xgbPara.booster().get_fscore()).sort_values(ascending=False) 我可以在pycharm中运行它，但是当我在pyspark中运行它时，有一个类型错误。有人能告诉我为什么吗？谢谢!

浏览 0提问于2018-11-16得票数 4

1回答

对DataFrame中的列调用Python函数

、、

下面的函数可以将字符串转换为大写字母 return col.upper()df['Description']= df['Description'].apply(changecase)TypeError: 'Column' object is not callable

浏览 2提问于2020-05-14得票数 0

4回答

问题

、、

我是比较新的火花，我遇到了一个问题，当我尝试使用python的内置循环()函数后，导入pyspark函数。这似乎与我如何导入吡火花函数有关，但我不知道其中的区别是什么，或者为什么其中一种方式会引起问题，而另一种方式则不会。预期行为：print(round(3.14159265359,2))意外行为： from pyspark.sql.functions_a

浏览 0提问于2018-09-28得票数 8

回答已采纳

1回答

迭代数据帧会更改列结构。

、、、

但是，当上面的for循环没有注释时，这会失败，因为'str‘对象是不可调用的。如果我们尝试用 print("hello") 'tuple‘对象不可调用。为什么在for循环上迭代导致联接失败？迭代是否以某种方式改变了底层数据？我以前见过在迭代中出现这种情况，但是有很多使用列/dtype的代码示例，正如我前面所展示的那样，工作非常好。

浏览 0提问于2021-03-03得票数 0

回答已采纳

1回答

md5不能处理pyspark中的复杂数据类型

、、、

我尝试在整行上使用md5函数计算哈希值。在pyspark dataframe中，我为几个列提供了多种复杂数据类型。md5时，md5抛出一个错误，消息如下：计算md5的代码： def pr

浏览 0提问于2020-11-26得票数 0

2回答

数据帧强制转换未引发溢出异常并生成null

、、

from pyspark.sql.functions import *我试图将数据帧转换为df.column.cast(ShortType())，但当我尝试插入数据99999时，它正在转换为null而不会抛出任何错误，所以您能否建议在转换时抛出错误的任何方法。

浏览 0提问于2021-05-17得票数 0

3回答

PySpark -来自列的to_date格式

、、

我目前正在尝试弄清楚，如何通过列参数将字符串格式的参数传递给to_date pyspark函数。('c','02-02-2018','dd-MM-yyyy')]).toDF(我目前正在尝试添加一个新列withColumn("test2",F.to_date(F.col("v

浏览 2提问于2018-09-10得票数 6

回答已采纳

1回答

TypeError：“JavaPackage”对象不可调用

、、、、

我在尝试运行字数统计示例时遇到以下错误。 File "/opt/spark/python/lib/pyspark.zip/pyspark/streaming/kafka.py"

浏览 9提问于2016-08-29得票数 3

1回答

使用列值作为火花DataFrame函数的参数

、、

+df = spark.createDataFrame([("X", 3),("Y", 1),("Z", 2)], ["letter", "rpt"])import pyspark.sql.functions as f f.posexplode(f.split(f.repeat(",&

浏览 2提问于2018-07-02得票数 11

回答已采纳

1回答

获取DataFrame的列值导致“Column”对象不可调用

、、、

对于从FileStore读取的流，我尝试检查第一行值的第一列是否等于某个字符串。不幸的是，当我以任何方式访问此列时，例如在它上启动.toList()，它抛出 if df["Name"].iloc[0].item() == "Bob": TypeError: 'Column'object is not callable 我从以下位置调用customProcessing函数： df.writeStream\

浏览 27提问于2020-12-17得票数 0

回答已采纳

1回答