使用dataframe.withColumn和变量似乎不起作用_php URL变量似乎不起作用_离子SASS变量似乎不起作用 - 腾讯云开发者社区

、、

我正在尝试编写如下语句: profileId = "some“df.withColumn("ProfileId"，df.withColumn(ProfileId))，并在DataBricks上获得一个AnalysisException。据我所知，这应该是有效的，所以我想知道是什么问题。任何帮助都将不胜感激。

浏览 20提问于2019-02-27得票数 0

回答已采纳

2回答

Python:用方法将self链接起来是否违反了德米特定律？

、、

在Python中，使用方法链接的代码非常常见，与其他地方的代码的主要区别是，这也与返回相同类型但已修改的对象结合在一起。这种方法通常假定对象是不可变的，并且只返回新实例。pyspark.sql import functions as F dataframe = dataframe.withColumn("a", F.rand()) dataframe = dataframe.withColumn("b&

浏览 0提问于2022-10-29得票数 1

回答已采纳

2回答

pyspark withColumn，如何改变列名

、、

""" """ #df = dataFrame.withColumn(f.col(colName), f.col(targetColName)) returndf out注释行不起

浏览 0提问于2018-09-13得票数 1

1回答

dataframe.orderBy(rand)与dataframe.withColumn("X"，兰德).orderBy(“X”)相同吗？

、

看着dataframe.orderBy(rand)dataframe.withColumn("X",rand).orderBy("X")这就引出了两个问题。在排序的上下文中，dataframe.orderBy(rand)与dataframe.withColumn("X",rand).orderBy("X&quo

浏览 0提问于2019-02-07得票数 1

回答已采纳

1回答

解析星火中嵌套的JSON列

、

"b":["abc","ab"]}这是我的预期输出：1,abc到目前为止，这就是我要来的，这是我现在得到的输出2

浏览 1提问于2019-03-21得票数 0

回答已采纳

1回答

如何在spark dataframe中获取记录的输入文件名？

我通过从s3加载制表符分隔的文件，在spark中创建了一个数据帧。我需要获取dataframe中每条记录的输入文件名信息，以便进一步处理。我试过了但是我得到了input_file_name的空值。谁来帮我解决这个问题。

浏览 0提问于2016-10-11得票数 5

回答已采纳

2回答

在吡火花数据帧中添加新列比较同一数据帧中存在的两列

、

我有一个有两列COL_1和COL_2的数据框架。我想再添加一列COL_3和COL_3值，这取决于下表中COL_1和COL_2的比较。当两个值都为不同的=无效时我尝试了一些代码下面的东西，但它不起作用。df_Input = dataframe.withColumn("COL_3", (col("COL_1") !

浏览 2提问于2020-03-01得票数 0

回答已采纳

1回答

使用Spark写入BigQuery中的JSON列类型

、、、

我想用Java管道写这封信，但我似乎找不到一种可能的方式。如果创建JSON的结构，则会产生RECORD类型。如果我像下面这样使用to_json，它将转换为STRING类型。dataframe = dataframe.withColumn("JSON_COLUMN, functions.to_json(functions.col("JSON_COLUMN))) 我知道BigQuery

浏览 3提问于2022-12-02得票数 0

1回答

如何使用SHA-2和随机盐加密spark sql数据帧列

、、、、

我使用的是Scala编程语言。我想使用SHA-2算法和随机盐加密整个列的spark sql数据帧我怎样才能把盐加到这个散列中？谢谢

浏览 26提问于2020-02-21得票数 0

回答已采纳

1回答

基于pyspark中其他列的过滤值创建列

、

我尝试创建一个名为k的新变量，它的值取决于metric是I还是M，否则我想返回一个空值。IIT| M| 6| 8|+---+-------+-------+------+---+---+ 我试过用这个，但不起作用dataframe= dataframe.withColumn('k', when ((col('metric') == 'M',(dataframe['metric'

浏览 0提问于2022-11-28得票数 0

回答已采纳

1回答

迭代C#中的spark dataframe列

、、、、

我正在使用microsoft.spark版本1.0.0来处理从网络接收到的一个parquet文件。似乎找不到如何将列转换为可枚举的方法，并且没有内置的方式来迭代列。任何指针都会有帮助。dataframe.WithColumn("alias", ExtractAlias(dataframe["userid"])) ExtractAlias(Column userID_column){need

浏览 29提问于2020-12-04得票数 0

回答已采纳

2回答

string for Python -不能将字符串列强制转换为十进制/双进制

、、

system_id: string (nullable = true)在创建DataFrame之后，我希望将列'gen_val'(存储在变量版本#1dataFrame = dataFrame.withColumn(results.inputColumns, dataFrame[results.inputColumns].cast('double'))错误

浏览 1提问于2017-10-25得票数 3

回答已采纳

3回答

数据帧Spark scala分解json数组

、、、、

currency":"USD"} |我一直在尝试使用如下的分解功能，但它不起作用。val newDF = dataframe.withColumn("nestedPayment", explode(dataframe.col("Payment"))) 任何帮助都是非常感谢的！

浏览 1提问于2017-03-17得票数 10

回答已采纳

1回答

在udf中使用广播火花变量时，如何确保在初始化变量之前不使用该变量？

、、、、

我的UDF和广播变量都属于一个可序列化的helper对象，我在类的顶部初始化了广播变量，并在该类的def中调用了UDF。然而，在评估期间，当尝试访问广播变量时，我会得到一个空指针异常。显然，这里的操作顺序并不像预期的那样发生(在加载广播变量的相关数据之前执行UDF )，所以我假设我需要某种方式来强制执行某种依赖/顺序。为了记录这一点，我不想用对象和类分离的特殊方式来实现它，这是我能想到的最好的方法，可以避免序列化我的UDF并确保UDF能够访问广播变量(它依赖于

浏览 5提问于2022-09-08得票数 0

回答已采纳

1回答

如何以最优的方式在不同的分析函数上使用相同的窗口分区？

、、

我使用相同的windows分区，并在其上运行不同的函数，如max、min和row_number。val windows = Window.partitionBy("id").orderBy(col("date").desc) dataframe.withColumn("max", max(col

浏览 5提问于2019-10-06得票数 1

回答已采纳

1回答

当foldLeft应用于dataFrame时，如何理解输出数据？

、

我试图使用Scala中的foldLeft & regex_replace从Dataframe的字符串列中删除新的行字符。该表有4列：id, id1, id2, id3和id3中有一个新的行字符。

浏览 0提问于2018-08-27得票数 1

回答已采纳

2回答

使用jquery保存会话变量似乎不起作用

、

我正在使用的代码： $.session("compareLeftContent","value");要使用的。

浏览 0提问于2013-02-15得票数 3

回答已采纳

2回答

Java中DataFrame上的SparkSQL和explode

、、

有没有一种简单的方法可以在SparkSQL DataFrame的数组列上使用explode？这在Scala中相对简单，但是这个函数在Java中似乎是不可用的(如javadoc中所提到的)。一种选择是在查询中使用SQLContext.sql(...)和explode函数，但我正在寻找一种更好的方法，尤其是更简洁的方法。DataFrame是从拼图文件加载的。

浏览 0提问于2015-08-06得票数 9

回答已采纳

1回答

如果是某个字符串Spark Scala，则更改列值

、

我正在尝试创建一个UDF函数来替换DF中的一些值。我有以下DF： df1| Periodicity || Monthly || Annual | +-------------+ 因此，如果我在这个DF中找到“年度”，我想将其更改为"EveryYear“，如果我找到"Daily”，则将其更改为"EveryDay“。这就是我正在尝试的： val modifyColumn = () => if (df1.col("Periodicity

浏览 16提问于2021-07-15得票数 0

1回答

WordSpec，使用“in”和“pending”似乎不起作用

、

从Specs2转移到Scalatest，我尝试使用WordSpec，但没有成功。我使用了来自的示例，但由于出现错误，它对我不起作用。然后，我复制了scaladoc中的基本测试，仍然有相同的问题。in (pending)[error] one error found 我试着搬到FunSpec，但不能强迫自己，WordSpec对我来说似乎更自然

浏览 0提问于2012-08-25得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云