腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
pyspark
用空字符串替换重复的反斜杠字符
apache-spark
、
pyspark
、
hive
在
pyspark
中,如何将文本( "\"\"")替换为空字符串.tried with regexp_replace(F.col('new'),'\‘,'')。但不起作用。
浏览 16
提问于2021-08-03
得票数 1
1
回答
表之间的
PySpark
正则表达式
匹配
python
、
apache-spark
、
pyspark
、
pyspark-sql
我正在尝试使用
PySpark
从列中提取
正则表达式
模式
。我有一个包含
正则表达式
模式
的数据帧,然后是一个包含我想要
匹配
的字符串的表。, 'Match1', 'Found1'),] df_regex = sql.createDataFrame(vals, columns) 我希望
匹配
浏览 27
提问于2019-01-22
得票数 3
回答已采纳
1
回答
使regex只
匹配
捕获组。
regex
、
split
、
pyspark
由于我目前正在使用的技术(
PySpark
API),我需要调整
正则表达式
,以便完全
匹配
对应于捕获组。此函数根据
匹配
的子字符串(而不是捕获组)拆分输入字符串。因此,我需要
匹配
\s+字符(目前只捕获这些字符)。我试图扩展积极的展望,将\d+\s+可能存在的可能性结合起来,从而
匹配
不同的\s。
浏览 2
提问于2019-12-03
得票数 1
回答已采纳
2
回答
将包含美元符号($)的子字符串替换为其他列值
pyspark
regex
、
apache-spark
、
replace
、
pyspark
我试过了from
pyspark
.sql.Types import StringType ) 和 from
pyspark
.sql.functions
浏览 149
提问于2019-03-18
得票数 2
回答已采纳
1
回答
PySpark
正则表达式
模式
匹配
apache-spark
、
pyspark
、
apache-spark-sql
我想把下面的
正则表达式
转换成
pyspark
。 例如:+420602642919-这些我们需要使用
正则表达式
过滤的电话号码 ("/^((\+|00)(42)|0)?((060|660|664|676|68[0-1]|688)([0-9]){7}|(699)([0-9]){8})$/") 如何在
Pyspark
中实现这一点?
浏览 70
提问于2020-01-22
得票数 0
1
回答
为什么我在RegexTokenizer中的
PySpark
转换与所需的
模式
相反?
regex
、
pyspark
、
tokenize
当我使用RegexTokenizer from
pyspark
.ml.feature来标记我的dataframe中的句子列以查找所有单词时,当python 包用于同一个句子时,我得到的结果正好相反。下面是示例代码:from
pyspark
.ml.feature import RegexTokenizer spark = SparkSession.builder另一方面,如果我在同一个句子中使用re模块,并使用相同的
模式
匹配
字母,在
浏览 3
提问于2020-05-06
得票数 1
回答已采纳
2
回答
在
PySpark
中提取几个正则
匹配
python
、
regex
、
apache-spark
、
pyspark
、
pyspark-dataframes
我目前正在编写一个regex,我想在
PySpark
Dataframe的专栏中运行它。 此
正则表达式
仅用于捕获一个组,但可以返回几个
匹配
的。我遇到的问题是,
PySpark
本机regex的函数(regexp_extract和regexp_replace)似乎只允许组操作(通过$ operand)。有没有一种方法(
PySpark
函数,而不是python的re.findall-基于udf)获取与我的regex
匹配
的子字符串列表(而且我不是说first
匹配
中包含的组)?grou
浏览 4
提问于2019-11-19
得票数 5
回答已采纳
1
回答
声明字段类型和实际字段类型不
匹配
时生成空值的
PySpark
SQLContext.createDataFrame
apache-spark
、
pyspark
、
apache-spark-sql
在
PySpark
(v1.6.2)中,当使用指定的
模式
将RDD转换为DataFrame时,值类型与
模式
中声明的值类型不
匹配
的字段将转换为null。from
pyspark
import SparkContextfrom
pyspark
.sql.types import StructTypesqlContext.createDataFrame(rdd, schema=schema) print df
浏览 27
提问于2016-07-27
得票数 0
回答已采纳
1
回答
如何使用
PySpark
的RegexTokenizer从字符串中删除数字?
python
、
apache-spark
、
pyspark
我想使用
PySpark
的RegexTokenizer从DataFrame列中删除5位或更多位的数字。我可以使用下面的代码提取这些数字,但有人知道我如何删除它们吗?
浏览 0
提问于2019-02-13
得票数 0
1
回答
检查
PySpark
列是否与
正则表达式
匹配
,并根据结果创建新列
python
、
regex
、
apache-spark
、
pyspark-dataframes
我有一个
PySpark
数据帧,看起来像这样:+----+--------------------++----+------------sampleexample.org|+----+--------------------+regex = '^\w+([\.
浏览 69
提问于2019-11-07
得票数 4
1
回答
如何在名称与特定条件
匹配
的几个列上使用cast
dataframe
、
pyspark
、
casting
、
pyspark-dataframes
在我的数据帧中,我需要将小列数据类型更改为long。下面的代码给出了空值。我该如何修复它? .withColumn("Fib", F.greatest(*[x for x in df.columns if x.startswith('fib_')])).show()
浏览 0
提问于2020-03-04
得票数 0
2
回答
根据第一个字符的外观分隔字符串列
python
、
regex
、
apache-spark
、
pyspark
我也尝试过Python方法,但正如预期的那样,它不适用于
PySpark
(通过扩展或类推() )。 提前谢谢你的帮助。
浏览 0
提问于2018-07-26
得票数 3
回答已采纳
1
回答
由于ExecutorLostFailure原因,无法使用spark读取拼图文件
python
、
pandas
、
apache-spark
、
pyspark
, 4]}) sc_conf =
pyspark
.SparkConf----> 1 parquet_file = spark.read.parquet('df.parquet') /opt/app-root/lib/python3.6/site-packages/
pyspark
self.n
浏览 19
提问于2020-06-16
得票数 0
回答已采纳
2
回答
匹配
URL路径
模式
的Regex
java
、
regex
、
lua
我有两个URI
模式
及其regex:2..+$" 但是使用上面的
正则表达式
,字符串/api/orders/123-blah$-789/v1既
匹配
正则表达式
模式
1,又
匹配
正则表达式<
浏览 11
提问于2022-08-10
得票数 0
2
回答
如何从regex
模式
列表中找到最具体的
匹配
?
c++
、
regex
我有一系列
正则表达式
模式
,并将传入的HttpRequest路径
匹配
到这些
模式
。我想迭代它们并找到最特定的
匹配
(一个URI可能
匹配
多个regex
模式
)。例如,"/static/images/foo.jpg"将
匹配
以下三种
正则表达式
模式
:^/static/images/^/
浏览 5
提问于2014-05-13
得票数 0
回答已采纳
4
回答
Lua
模式
匹配
与
正则表达式
regex
、
lua
、
lua-patterns
关于lua中的
模式
匹配
,我在lua.org上的lua文档中找到了以下句子: 尽管如此,Lua中的
模式
匹配
是一个强大的工具,并且包括一些难以与标准实现相
匹配
的功能。因为我熟悉posix
正则表达式
,所以我想知道是否有任何常见的示例表明lua
模式
匹配
比
正则表达式
“更好”--或者我误解了这句话?如果有任何常见的例子:为什么
模式
匹配
与
正则表达式
更适合?
浏览 116
提问于2010-04-23
得票数 63
回答已采纳
1
回答
在Bash中由regex完成
模式
匹配
的位置?
bash
在Bash中有几个使用
模式
匹配
的地方。在Bash中,
正则表达式
是否只在[[..]]中与=~运算符进行
模式
匹配
?是否还有用regex进行
模式
匹配
的其他地方?
浏览 0
提问于2016-03-19
得票数 -1
回答已采纳
2
回答
正则表达式
负向前视以
匹配
降价链接
.net
、
regex
、
regex-lookarounds
我们被一个
正则表达式
问题卡住了。1) [hello] [world]我们需要编写一个
正则表达式
,它只能
匹配
第一个
模式
中的[world]和第二个
模式
([hello [world]])中的整个
模式
。通过使用负向先行,我编写了以下
正则表达式
,它解决了部分问题:此
正则表达式
与
模式
1)<e
浏览 1
提问于2017-10-20
得票数 5
1
回答
具有动态架构且不使用Pandas的
PySpark
中的DataFrame为空
python
、
apache-spark
、
pyspark
我想创建一个空的Dataframe,该
模式
应该与手动尝试使用Structtype的现有
Pyspark
Dataframe .I相
匹配
。
浏览 12
提问于2021-06-28
得票数 0
1
回答
使用spark-sql或
pyspark
模式
在列之间
匹配
的转换
azure
、
tsql
、
pyspark
、
apache-spark-sql
列A
模式
如果它与列C中的
模式
匹配
,则用1更新好的东西,否则(-)
pyspark
、sparksql中的任何查询 感谢Anuj Gupta
浏览 8
提问于2021-11-09
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
正则表达式笔记(二)——利用模式进行匹配
正则表达式匹配
正则表达式匹配IP地址
讲解leetcode问题:正则表达式匹配
2.8多行匹配模式
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券