腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Scala
代码
,
用于
替换
列表
形式
的
dataframe
中
的
列
的
空
值
list
、
scala
、
replace
我正在尝试
替换
列表
形式
的
数据集中
的
空
值
。我使用了下面的
代码
,我仍然没有给出我想要
的
结果。我该怎么办?我使用了下面的
代码
: val mergedDS =customerDS.join(acctstep1,Seq("customerId"),"outer") .withColumn("numberAccounts
浏览 11
提问于2020-04-23
得票数 0
3
回答
火花数据
中
的
空
值
scala
、
apache-spark
我正试图将数据格式插入卡桑德拉:然而,一些
列
值
是
空
的
,因此我得到了异常:at
scala
.collection.immutable.StringOps.toFloat(StringOps.
scala
:com.datastax.sp
浏览 7
提问于2017-05-08
得票数 2
回答已采纳
2
回答
火花数据na.fill布尔
列
类型
apache-spark
我能够使用以下方法填充数字和字符串类型
列
:masterDF = masterDF.na.fill("")但是我没有找到api来填充布尔类型
列
。
浏览 0
提问于2018-06-28
得票数 1
回答已采纳
2
回答
多类分类
的
RandomForestClassifier SPACK2.x
scala
、
apache-spark
、
apache-spark-mllib
、
random-forest
、
multiclass-classification
我试图使用随机森林进行多类分类,使用spark 2.1.1我有一个包含多个字符串类型
列
的
dataframe
。我是通过将StringIndexers与VectorAssembler链接起来来创建管道
的
,最后是用标签转换器连接RandomForestClassifier。我已经用distinct().count()检查了我
的
所有
列
,以确保我没有太多
的
类别,等等。经过一些调试后,我了解到每当我开始对某些<
浏览 1
提问于2018-02-12
得票数 1
回答已采纳
4
回答
如何使用Java
中
的
spark将数据数据
中
的
特定
值
替换
为
空
值
?
java
、
apache-spark
我正在努力提高Logistic回归算法在Spark中使用Java实现
的
准确性。为此,我试图用该
列
最常见
的
值
替换
列
中
的
空
值
或无效
值
。例如:-a |a1a |a2b |a2c |d |c1 在本例
中
,我将将
列
"Name“
中
浏览 0
提问于2017-06-21
得票数 27
回答已采纳
1
回答
在该行
的
任何
列
中选择至少一个
空
或
空
的
行。
scala
、
apache-spark
从一个
dataframe
中
,我想创建一个新
的
dataframe
,其中任何
列
中
至少有一个
值
为null或
空
,在Spark1.5/
scala
中
。我正在尝试编写一个通用函数来创建这个新
的
dataframe
。在这里,我传递数据文件和
列
列表
,并创建记录。 谢谢
浏览 4
提问于2017-07-25
得票数 4
回答已采纳
1
回答
只在一
列
中
替换
空
值
,而不是对所有
列
替换
空
值
。
python
、
apache-spark
问题:为什么下面的
代码
只在第一
列
上用
空
值
替换
空
值
,而不
替换
具有空
值
的
其他
列
?例如,如果column1和column2没有空
值
,而column3、column6、column9有空
值
,则只能在column3
中
替换
空
值
,而在column6和column9
中
则不
替换</em
浏览 16
提问于2022-05-09
得票数 0
1
回答
Pyspark
Dataframe
:无法解析
列
的
计算平均值/平均值/agg(包括
空
值
)
exception
、
pyspark
、
casting
、
apache-spark-sql
、
dataset
我正在运行一个胶水作业,并且我
的
数据集包含一个
列
,该
列
的
运行爬网程序
的
空
values.As很少,该
列
的
数据类型被标识为'double‘。当用
列
的
均值
替换
空
值
时,我不能计算均值,因为它说均值/avg/agg只能应
用于
数值
列
。在对IntegerType或DecimalType进行类型转换时
da
浏览 3
提问于2020-05-30
得票数 0
1
回答
无法将Spark
Dataframe
中
的
空
值
替换
为整数值
scala
、
dataframe
、
apache-spark
、
apache-spark-sql
在我
的
Employees
DataFrame
中
,我希望将佣金
列
中
的
空
值
替换
为一个特定
值
(设为500)。我正在使用下面的命令
替换
所有空
值
,但我不知道Map
中
的
空
值
应该是什么: `employeeDF.na.replace("commission", Map("" -
浏览 32
提问于2019-10-13
得票数 1
回答已采纳
3
回答
将多
列
中
的
所有
值
设置为
空
列表
python
、
pandas
、
replace
、
assign
我有一个
dataframe
,它
的
列
中有
列表
或
值
,如下所示: A B C D1我想用
空
列表
替换
列
A、B和C
中
的
所有
值
。我尝试将.assign(column_name='value')分别
用于
A、B和C
浏览 7
提问于2021-10-20
得票数 0
回答已采纳
1
回答
在中用
空
值
替换
空
值
scala
、
apache-spark
、
dataframe
、
apache-spark-sql
我有一个有n个
列
的
数据框架,我想用空字符串
替换
所有这些
列
中
的
空字符串。
浏览 2
提问于2017-05-21
得票数 3
1
回答
填充熊猫数据
的
数组
列
中
的
空
列表
python
、
arrays
、
pandas
、
list
、
dataframe
我需要使用一些字符串填充
dataframe
数组
列
中
的
空
列表
。| array || [] || [] | 我想用字符串
值
替换
空
列表
。
浏览 6
提问于2022-10-26
得票数 0
回答已采纳
1
回答
创建不可
空
的
空
数组
列
scala
、
apache-spark
我在
scala
中使用spark(2.4)。我有一个
dataframe
,我正在尝试用dé故障
值
(
空
数组)
替换
空
值
(我
的
数组
列
)。String], def ensureNonNullCol:
DataFrame
=>
DataFrame
= inputDf =
浏览 7
提问于2022-08-02
得票数 0
1
回答
用
空
值
填充
scala
列
scala
、
apache-spark
、
dataframe
当我试图用
空
值
填充一个
DataFrame
来
替换
其中
的
其他
值
时,我得到了错误
的
Caused by:
scala
.MatchError: Null (of class
scala
.reflect.internal.Types我如何使用
Scala
Spark 2.1来做这件事?
浏览 28
提问于2017-03-17
得票数 0
回答已采纳
4
回答
Spark
scala
删除仅包含
空
值
的
列
scala
、
null
、
spark-dataframe
有没有一种方法可以删除spark
dataFrame
中
只包含
空
值
的
列
?(我使用
的
是
scala
和Spark 1.6.2)var validCols: List[String] = List() .count if (count >= 2){ validCols ++= List
浏览 6
提问于2016-09-11
得票数 7
2
回答
替换
列
值
中
的
括号
python
、
dataframe
我在
dataframe
中有一个名为'Timestamp‘
的
列
。它具有逗号连接
的
列表
形式
的
值
。我想把这些不同
的
列表
组合成一个
列表
。我可以
替换
单个字符,但当我作为一个整体进行
替换
时出现错误,我该怎么做呢?示例:1
列
的
1行
值
为'2021-10-03 05:29:39.199','
浏览 0
提问于2021-11-19
得票数 0
3
回答
用星火
DataFrame
中
列
的
平均值
替换
列
的
空
值
apache-spark
、
pyspark
、
apache-spark-sql
Spark
中
是否有函数可以通过忽略null/NaN来计算
DataFrame
中
列
的
平均值?就像在R中一样,我们可以传递一个选项,比如na.rm=TRUE。当我在带有NaN
的
列上应用avg()时,我只得到NaN。
浏览 1
提问于2017-09-17
得票数 2
回答已采纳
1
回答
将pandas
dataframe
中
的
空
字典和
列表
替换
为Null
python
、
pandas
、
list
、
dictionary
、
null
我有一个
列
中
包含
列表
和字典
的
dataframe
。我该如何编写一个函数来应
用于
需要将
空
字典和
列表
替换
为Null
的
列
?def transform_empty_cells(column):尝试创建一个整洁
的
函数,而不必为每一
列</e
浏览 3
提问于2020-02-05
得票数 1
1
回答
使用模式对数据进行重新采样会得到
空
列表
...需要将这些
空
列表
转换为0
python
、
python-3.x
、
pandas
当我使用模式重采样数据(在DateTime上建立索引)时,我会得到一些
空
列表
形式
的
值
。我需要将这些
空
列表
('[]')
值
替换
为0
dataframe
= data.resample('10min').apply({'data':lambda x: x.mode(dropna= False)})
dataframe
[&
浏览 1
提问于2019-08-16
得票数 0
1
回答
在Apache Spark NA函数中使用哪个更好,Replace还是Fill?
apache-spark
、
apache-spark-sql
、
spark-dataframe
fill函数处理null
值
。但是我也可以使用replace函数来
替换
空
值
。哪一个更好?为什么?
浏览 27
提问于2017-08-11
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据分析工具Pandas的数据结构学习
肝了3天,整理了90个Pandas案例
最全攻略:数据分析师必备Python编程基础知识
23种Pandas核心操作,数据处理的利器
pandas系列学习(三):DataFrame
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券