在Spark Dataframe中查找总空值_查找Spark dataframe中非空值的计数_Spark dataframe过滤空值和空格 - 腾讯云开发者社区

、、、

(1, 4, None), (1, 6, float("nan")), ] df = spark.createDataFrame(data, ("session", "timestamp1", "id2")) 我正在尝试查找用于获取输出的null或None值的总数 df.select([count(when(isnan(c) |我找

浏览 90提问于2021-09-14得票数 0

2回答

Spark DataFrames中的argmax :如何检索具有最大值的行

、

给定一个Spark DataFrame df，我想在某个数值列'values'中找到最大值，并获得达到该值的行。我当然可以这样做：# since I hope I get this done with DataFramepandas.Series/DataFrame和numpy.array的argmax/idxmax方法可以有效地实现这一点(<

浏览 0提问于2016-08-07得票数 15

回答已采纳

1回答

查找Spark dataframe中非空值的计数

、、

数据帧的类型为org.apache.spark.sql.DataFrame。

浏览 36提问于2020-07-05得票数 0

回答已采纳

2回答

Spark fillNa不替换空值

、

我有下面的数据集，它包含一些空值，需要在spark中使用fillna替换空值。DataFrame：| 5| null| Bob| | 50|

浏览 1提问于2016-11-03得票数 20

回答已采纳

1回答

我有一个特定的要求，其中我需要检查空的DataFrame。如果为空，则填充默认值。这是我尝试过的，但没有得到我想要的。def checkNotEmpty(df: org.apache.spark.sql.DataFrame, col: String):org.apache.spark.sql.DataFrame =) val age = checkNotEmpty(w_feature_md.filter("age='22&#

浏览 4提问于2016-09-16得票数 2

1回答

使用HiveQL和Spark中的列平均值填充空值

、

我在spark中使用了HiveQL，并且希望通过spark中的列来填充空值。使用以下代码： String[] cols = dataFrame.columnsString col : cols) { query.append(",`" + col + "`

浏览 0提问于2017-08-07得票数 0

2回答

Spark DataFrame对数据集为空

、

从MS SQL数据库导入数据时，可能会出现空值。在Spark中，DataFrames能够处理空值。但是，当我尝试将DataFrame转换为强类型Dataset时，收到编码器错误。Int], var b: Option[Int]) def main(args: Array[String]): Unit = { val df =

浏览 2提问于2017-03-31得票数 0

1回答

左联接错误: org.apache.spark.sql.AnalysisException:检测到逻辑计划之间的左外部联接的隐式笛卡尔乘积

、、

*编辑 df_joint = df_raw.join(df_items,on='x',how='left') Apache Spark 2.4.5中出现标题异常 df_raw有2列"x“、"y”的数据，而df_items是模式的空数据框，还有其他一些列左连接发生在null的值上，它应该从第一个dataframe中获取整个数据，并从第二个dataframe中获取空列。当&q

浏览 31提问于2020-12-20得票数 0

1回答

星星之火:未能将包含空值的布尔列发送到Oracle

、、、

我有一个包含布尔列(TRUE、FALSE、NULL)的dataframe。当我使用Spark2 Scala将此数据发送到Oracle19c中的现有表时，由于错误: java.sql.SQLException:无效列类型: 16，它失败了。但是，当它们不是dataframe中的空值时，任务就成功地完成了。此外，如果我将一个空值直接插入到Oracle中的布尔字段中，我就没有问题(这只是为了在</

浏览 2提问于2021-03-21得票数 1

3回答

如何删除每组记录计数低于阈值的记录？

、、、

这里是DataFrame：---------------------------2 | restaurant| 200004 | auto | 10000如何查找每个sector类型的计数，并删除sector类型计数低于特定LIMIT的记录dataFrame.groupBy(columnName).coun

浏览 0提问于2016-03-15得票数 2

回答已采纳

1回答

使用spark* scala读取列值为空的CSV文件时出错*

我正在尝试使用spark Scala分析CSV文件，但问题是我的CSV文件包含空值的列，所以当从CSV文件读取数据时，我得到的错误为java.lang.ArrayIndexOutOfBoundException:12 我在CSV文件中的总列数是13，但有1列包含空值。

浏览 7提问于2017-07-01得票数 0

2回答

在scala spark中处理灵活模式json时，如何处理缺少的列？

、、、

使用spark streaming读取kafka消息，其中V= Json事件。Json的模式不是强制的，因此您可能会获取以下两个事件：{"foo": "01/01/1974"} 在字段不存在的情况下，如何使用read.json和df.registerTempTable("tempTable")创建一个插入<em

浏览 2提问于2018-03-07得票数 1

2回答

Spark DataFrameWriter ignoreNullFields不工作

、

我有一个包含多个具有不同模式的空值的DataFrame+----+----+----+----++----+----+----+----++----+----+----+----+但即使我使用 spark.write.option("

浏览 50提问于2020-02-27得票数 3

2回答

访问空数组或空数组时引发错误

、、、

doe", "home": ["1111", "222"], }家庭电话号码数组有时可能是空的我的spark应用程序收到这些JSONS的列表，并执行以下操作：val result =

浏览 2提问于2017-05-21得票数 3

回答已采纳

1回答

spark中用于检查数据帧中的列的isNullOrEmpty函数为null或空字符串

、、、

如何检查dataframe的列是否为null或空ins spark。例如。type IdentifiedDataFrame = {SourceIdentfier, DataFrame} seq((DeltaTableStream(RequestWithTransactionId), df.filterServ

浏览 85提问于2021-07-08得票数 0

1回答

如何从pyspark中的dataframe列中选择不同的非空值

、

如何从py-spark中的dataframe列中选择不同的非空值。

浏览 30提问于2021-07-03得票数 0

1回答

理解pandas_udf

、、

pandas_udf文档中的文档页面有以下段落：用户定义的函数不支持布尔表达式中的条件表达式或短路，最终只能在内部执行。如果函数在特定行上可能失败，则解决方法是将条件合并到函数中。它似乎是说，UDF不支持条件语句(如果其他块)，然后建议解决方法是在函数体中包含if else条件。这对我来说毫无意义。请帮帮忙

浏览 2提问于2021-10-28得票数 2

12回答

如何创建一个空的DataFrame？为什么"ValueError: RDD是空的“？

、

我正在努力创建一个空的数据在火花(火花)。Traceback (most recent call last):File "/Users/Me/Desktop/spark_createFromRDD(data, schema, samplingRatio) File "/Users/Me

浏览 4提问于2016-01-06得票数 34

回答已采纳

2回答

Spark 2.0，DataFrame，筛选字符串列，不等运算符(!==)已弃用

、

我正在尝试过滤DataFrame，只保留那些具有特定字符串列的行不为空。df.filter($"stringColumn" !== "")如何检查Spark > 2.0中的字符串列值是否为空？

浏览 1提问于2016-10-20得票数 22

回答已采纳

1回答

正向填充Spark/Python中的缺失值

、、、、

我正在尝试用以前的非空值(如果存在)填充我的Spark dataframe中缺少的值。我在Python/Pandas中做过这种事情，但是我的数据对于Pandas (在一个小集群上)来说太大了，我是Spark noob。这是Spark可以做到的吗？它可以对多个列执行此操作吗？如果没有，在谁的Hadoop工具套件中有任何替代方法的建议吗？谢谢!

浏览 0提问于2016-07-01得票数 8

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云