腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
对
多个
键值
应用
regexp_replace
spark
函数
?
、
、
假设有一个Map,其
键值
对
或文本如下: "x1" -> "a", "80" -> "AB"有没有办法像这样在循环中使用
regexp_replace
调用来添加新列: df.withColumn("newColumn", pairs.mapSomeHow((k,v) =>
regexp_replac
浏览 2
提问于2019-10-23
得票数 0
回答已采纳
1
回答
如何
重命名现有的
Spark
SQL
函数
、
、
我正在使用
Spark
对
用户提交的数据调用
函数
。
如何
将已存在的
函数
重命名为其他名称,如将
REGEXP_REPLACE
重命名为REPLACEss.udf.register("REPLACE",
REGEXP_REPLACE
)
浏览 11
提问于2017-12-11
得票数 0
回答已采纳
1
回答
在pyspark的
regexp_replace
函数
中使用字典
、
、
、
我想使用字典
对
pyspark dataframe列执行
regexp_replace
操作。字典:{'RD':'ROAD','DR':'DRIVE','AVE':'AVENUE',....}字典将有大约270个
键值
对
。如果试图像下面的代码那样传递字典- data=data.withColumn('Address_Clean',
regexp_replace
('Ad
浏览 0
提问于2018-05-08
得票数 1
1
回答
HIVE,
如何
从数组中获取元素,元素本身也是一个数组
、
、
、
字符串本身包含
多个
元素,如数组。每个元素包含
多个
键值
对
。一些值还可以包含
多个
键值
对
,例如,下面的"address“属性。) AS phone, FROM people lateral view explode(split(
regexp_replace
(
regexp_replace
(info, &
浏览 8
提问于2016-09-30
得票数 0
2
回答
如何
在AWS Glue中设置
多个
-conf表参数?
、
对于AWS来说,在堆栈溢出上有
多个
答案来设置--conf表参数。然而,有时在一个作业中,我们需要在一个作业中设置
多个
-conf
键值
对
。用表-conf参数的值中的空格分隔配置
键值
参数。在表-conf参数的值中用逗号分隔配置
键值
参数。将--conf的值设置为让--conf字符串分隔每个
键值
。
如何
在AWS Glue中设置
多个
-conf表参数?
浏览 1
提问于2019-04-04
得票数 7
回答已采纳
1
回答
Spark
CSV读取忽略字符
、
、
我通过齐柏林飞艇使用
Spark
2.2.1。现在我的
spark
读取代码如下: val data =
spark
.read.option("header", "true").option("delimiter", ",").option("treatEmptyValuesAsNulls","true").csv("listings.csv") 我注意到,当我使用.show()
函数
时,单元
浏览 14
提问于2020-04-23
得票数 0
1
回答
如何
在
Spark
中将
多个
sql
函数
包装成一个UDF?
、
、
我正在使用
Spark
2.3.2。 在我的Dataframe中的一列中,我顺序地执行了许多
spark
.sql.functions。
如何
将这个
函数
序列封装到一个用户定义
函数
(UDF)中,以使其可重用? 下面是我的示例,重点是"columnName“这一列。)+----------++----------++----------+ */ 下面是
应用</
浏览 30
提问于2020-10-05
得票数 1
回答已采纳
1
回答
如何
使用PySpark的RegexTokenizer从字符串中删除数字?
、
、
我可以使用下面的代码提取这些数字,但有人知道我
如何
删除它们吗?
浏览 0
提问于2019-02-13
得票数 0
1
回答
如何
在Scala中的dataframe上
应用
regex_replace时,修复异常“当前不支持'E‘类型的文字”?
、
、
、
我通过读取RDBMS表创建了一个数据文件,如下所示:在将数据摄取到HDFS上的Hive表之前,我们被要求在具有字符串数据类型的dataframe列上
应用
我就是这样
应用
它的: if (x.dataType == StringType) "<
浏览 0
提问于2018-08-25
得票数 0
回答已采纳
2
回答
如何
将dataframe的列值替换为与输入值匹配的空字符串?
、
、
输入数据 (2,"
Spark
framework"),预期数据 (2,"
Spark
framework"), (3,"spring framework")).toDF("id&
浏览 2
提问于2018-07-02
得票数 1
回答已采纳
2
回答
SparkSQL正则表达式:无法从文本中移除反斜杠
我尝试了以下几点:
spark
.sql("select
regexp_replace
('ABC\123XYZ\456','[\\][\d][\d][\d]',''
浏览 10
提问于2022-10-13
得票数 0
回答已采纳
2
回答
替换
spark
中的转义字符
、
、
dec", StringType), StructField("amount",IntegerType), StructField("enabled",BooleanType))) val rdd =
spark
.sparkContext.parallelize
浏览 0
提问于2017-11-07
得票数 1
2
回答
如何
在scala中
对
Dataframe的字符串列
应用
正则表达式模式?
、
我有一个数据帧yeadDF,它是通过读取一个关系数据库表创建的,如下所示:
regexp_replace
(
regexp_replace
(
regexp_replace
(
regexp_replace
(
regexp_replace
(%s, E'[\\\\n]+' ', &
浏览 6
提问于2018-08-21
得票数 0
回答已采纳
2
回答
吡火花udf清洁html标记获取typeerror
、
、
我刚开始使用pyspark,而且我很难将python
函数
转换为pyspark。clean', clean_html(df.summary))怎么做才是
对
的
浏览 1
提问于2019-06-01
得票数 0
回答已采纳
1
回答
如何
使用
Spark
在Scala中返回多列键和值
对
、
我想把下面的RDD转换成
键值
对
,每个键有两个值。第一列应该是键,第二列和第三列应该是值。
如何
使用scala中的Case类执行转换?scala> input[Hardware,Hardware,null][Adventure,Adventure,null]
浏览 0
提问于2018-05-29
得票数 0
2
回答
如何
在pyspark中将映射字符串转换为映射
、
name_value"[quality1 -> good, quality2 -> excellent]"
如何
使用
浏览 42
提问于2021-10-04
得票数 0
回答已采纳
2
回答
在JSON中读取字典
、
、
mdf.show(false)+--------++--------+|[value2]|我想要查看名称-值
对
?
浏览 2
提问于2018-04-05
得票数 3
1
回答
存储
多个
键值
对
SecKeyChain
、
、
应用
程序要求我在KeyChain iOS.When中根据
键值
对
存储
多个
敏感数据,我在Xamarin中使用SecKeyChain,它只存储一个
键值
对
。
如何
在Keychain-ios、Xamarin-iOS中存储
多个
键值
对
?
浏览 1
提问于2016-05-17
得票数 1
1
回答
Scala +
如何
从文件中替换
Spark
Dataframe列中的占位符?
、
、
config_file_path) config_file.close() val inputDF =
spark
.read.optiongetClass.getReso
浏览 28
提问于2019-04-05
得票数 1
1
回答
在to_base64中使用带反向引用的
regexp_replace
和MariaDB
函数
、
现在我想
对
结果进行base64 64编码,所以ba应该变成YmE=:+-----------------+| YmE= |1 row in set (0.000 sec) 但是,当我在to_base64中
应用
regexp_replace
函数
时,它不再解释我的反向引用并编码\2\1而不是ba
浏览 0
提问于2019-09-13
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Spark Streaming 2.2.0 Example
Apache Spark 2.4 内置的 Avro 数据源实战
Spark1.6官方文档译文系列一
5种好用的流计算系统
大数据第二篇-计算引擎
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券