文章/答案/技术大牛

发布

社区首页 >问答首页 >访问数据火花的所有行的字段

问访问数据火花的所有行的字段
EN

Stack Overflow用户

提问于 2022-11-21 11:48:09

回答 2查看 42关注 0票数 0

好吧，那似乎很容易，但我找不到任何解决办法或对它的反应。我只是有一个包含满为空的列的dataframe，我只想随机地填充"s“或"n”。

我试过了

df.foreach(f=>{
  
  if(random)
    f.get(4) = "s"
  else{f.get(4) = "n"}
})

但是不起作用，因为我认为f只是一个列表，而不是伪的实际值：

for(i=0;i<max_rows;i++)
  if(prob<.5)
   {df[i]["column_field"] == "s"}
  else
   {df[i]["column_field"] == "n"}

scala

apache-spark

apache-spark-sql

回答 2

Stack Overflow用户

发布于 2022-11-21 14:40:48

替换所有整数列和长列

df.na.fill(0)
  .show(false)

用特定列替换

df.na.fill(0,Array("population"))
  .show(false)

字符串类型所有列

df.na.fill("")
  .show(false)

特定列

df.na.fill("unknown",Array("city"))
  .na.fill("",Array("type"))
  .show(false)

票数 0

Stack Overflow用户

发布于 2022-11-22 05:48:59

DataFrame na填充

类DataFrame

对于您的问题，每一行都有新值。

import org.apache.spark.sql.SparkSession
import org.apache.spark.sql.functions._
import spark.implicits._
val df1 = Seq((0.5f, "v1"), (0.2f, "v2"), (1f, "v3"), (4f, "v4"))
  .toDF("prob", "column_field")
df1.show(false)
/*
+----+------------+
|prob|column_field|
+----+------------+
|0.5 |v1          |
|0.2 |v2          |
|1.0 |v3          |
|4.0 |v4          |
+----+------------+
*/
val resDF = df1.withColumn(
  "column_field",
  when(col("prob") <= 0.5f, "s")
    .otherwise("n")
)

resDF.show(false)
/*
+----+------------+
|prob|column_field|
+----+------------+
|0.5 |s           |
|0.2 |s           |
|1.0 |n           |
|4.0 |n           |
+----+------------+
*/

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/74518429

复制

相似问题

问访问数据火花的所有行的字段
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问访问数据火花的所有行的字段EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问访问数据火花的所有行的字段
EN