腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
字符串
型
数组
中
的
数据
帧
regexp_extract
值
、
、
、
、
我
的
DataFrame如下所示:100 ["20", "25.5", "40.23", "50"]300 ["20", "25", "50", "35"] 我需要提取<em
浏览 22
提问于2020-03-06
得票数 2
回答已采纳
3
回答
Spark:从失败
的
regexp_extract
()返回null
、
、
假设您尝试从
数据
帧
的
列中提取一个子
字符串
。如果字段本身为null,则
regexp_extract
()返回null,但如果field不为null但未找到表达式,则返回空
字符串
。对于后一种情况,如何返回空
值
?df = spark.createDataFrame([(None),('foo'),('foo_bar')], StringType()) df.select(
regexp_extract
('valu
浏览 1
提问于2017-02-11
得票数 4
1
回答
在Spark Scala
中
对
数组
的
每个成员应用函数
、
、
我在一个
数据
帧
中有一个列,它是一个
字符串
数据
类型
数组
。我需要提取
字符串
的
一部分,因此我需要对
数组
中
的
每个元素应用正则表达式。所以我想使用scala Dataframe API来应用它。
regexp_extract
($"myString","(\\d+)-(\\d+)",1).cast(LongType) 在
数组
的
每个成员上
浏览 20
提问于2021-04-24
得票数 1
1
回答
从pyspark dataframe
中
的
列返回字母数字
值
、
、
、
我有一个pyspark
数据
帧
df。它有2列,类似于下面显示
的
示例输入。我想创建一个新
的
输出
数据
帧
,其中包含一个新列'col3‘,该列只包含来自col2
中
字符串
的
字母数字
值
。我尝试过使用spark sql和但它只返回null。 有谁
浏览 0
提问于2021-02-15
得票数 0
2
回答
应用和应用给出了is.character()
的
不同结果
、
、
我试图将
数据
的
特征转换为tolower,并发现这篇文章: 看上去更好
的
是Stackoverflow,我发现第二篇文章使用lapply部分解决了这个问题,但奇怪
的
是,它建议以类似的方式应用和应用工作。因此,我最终建立
浏览 2
提问于2017-02-26
得票数 2
回答已采纳
1
回答
Google Data Sttudio
中
的
Regex提取
、
、
如何从字段
中
的
数组
中提取
字符串
?我能够使用分解维来获取
数组
,但我似乎无法弄清楚如何使用
REGEXP_EXTRACT
来获得‘友好_名称’。我试过这个
REGEXP_EXTRACT
(shared_attrs, '^friendly_name:\\s?"?([^";,]*)'),但没有用。
浏览 9
提问于2022-04-15
得票数 1
回答已采纳
1
回答
在Scala
中
,如何使用locate()作为参数创建带有子
字符串
()
的
列?
、
、
、
,只包含Id之后
的
值
。更新更新,给出一个@wBob不适用于我
的
真实世界
数据
的
例子:我
的
数据
确实比上面的例子要复杂一些。ion: ip_s-")这些
值
是非常长
的
字符串
,没有特定
的
模式。在
字符串
中
的
某个位置,它始终是编写ID XXXXX
的
一部分。XXXXX是不同
的
,但它总是相同
的</e
浏览 4
提问于2022-05-10
得票数 0
回答已采纳
1
回答
将
regexp_extract
和regexp_replace组合起来,在pyspark列
中
屏蔽数字
、
、
因此,在上面的示例
中
,更新
的
值
应该是X Broad Street,而不是XXX-XX-XXXX Broad Street。index|address||1|123 Apple Street||-----|-------|regexp_replace(
regexp_extract
(df["
浏览 1
提问于2020-06-08
得票数 0
回答已采纳
1
回答
蜂巢或黑斑羚
中
的
REGEXP_EXTRACT
提取子串
、
、
、
、
嗨,我是新来
的
,我用
regexp_extract
从
字符串
中
获取子
字符串
。我
的
固定消息是10123=TICKET~}|167=CS~}|1=XTL9911~}|336=REG~}|10120= ~}|111=909~}|我正在使用下面的 选择
regexp_extract
(fixmessagestr, '}1=(.*?)'
浏览 1
提问于2022-01-26
得票数 -1
1
回答
配置单元
REGEXP_EXTRACT
提取模式
的
第二个匹配项
、
我在Hive
中
查询
数据
,并从列中提取代码。我最近发现,由于
数据
输入/业务流程问题,用户重载了字段并输入了两个单独
的
职务代码,而实际上应该只有一个。该列
中
的
示例
数据
:我一直使用
REGEXP_EXTRACT
(column,'([我想使用两次
REGEXP_EXTRACT
和别名id_1和id
浏览 3
提问于2018-07-11
得票数 2
1
回答
返回空
的
单元
regexp_extract
、
、
、
对于正则表达式
的
世界来说,相对来说是比较新
的
,所以请容忍我。我正在尝试使用
regexp_extract
提取
字符串
中
的
某个
数据
子集,但它正在为我当前试图使用
的
正则表达式返回NULL。有关规定如下:
字符串
-> test= 123355 ->123355 这样做
的
目的是在test=之后提取所有
数据
浏览 0
提问于2018-11-29
得票数 3
回答已采纳
1
回答
当您使用insert into命令时,Hive是否创建新
数据
?
我有关于“插入到”和“插入覆盖”命令
的
问题。CSV文件
的
每一行都是col_value列
中
的
一行。将第一个表
中
<e
浏览 1
提问于2019-01-04
得票数 0
1
回答
google
数据
演播室
中
的
regexp提取
、
、
、
我想在
中
创建一个计算字段,它只返回
字符串
开头
的
数字,该
字符串
可能如下所示:oror
REGEXP_EXTRACT
(Campagne, '.*')
REGEXP_EXTRACT
(C
浏览 2
提问于2017-11-06
得票数 1
回答已采纳
3
回答
提取前两个字符之间
的
字符
、
、
BigQuery有一张桌子:arfd_am_fdsf_fddg_fg我想提取那些紧跟在第一个字符之后,然后是第二个字符
的
字符我想得到以下信息:am我使用了以下正则表达式来提取字符,但它不像预期
的
那样工作:regexp_replace(id,'^.
浏览 6
提问于2020-12-27
得票数 0
回答已采纳
2
回答
更改Pandas
数据
帧
类型时
的
异常处理
、
我有一个只有一列
字符串
列
的
Pandas
数据
帧
。我想将列
数据
转换为浮点
型
。由于格式
的
原因,某些
值
无法转换为浮点
型
。我想从结果中省略这些“非法
字符串
”,只提取可以合法地重新转换为浮点数
的
值
。起始
数据
:test.loc[0,'Value']='<3' test.loc[1,'
浏览 4
提问于2014-05-12
得票数 5
回答已采纳
1
回答
使用HiveQL正则表达式提取句点之前
的
所有字符?
、
、
、
我有张桌子看起来像:foo.bar我想使用HiveQL
的
regexp_extract
返回foo bar
浏览 1
提问于2016-08-29
得票数 4
回答已采纳
2
回答
使用正则表达式提取分解Google Data Studio
中
的
竖线分隔
字符串
和返回段
、
我有一个包含
字符串
的
文件,
字符串
以竖线分隔,如下所示: value 1|value 2|value 3 在Datastudio
中
,我尝试了我在这里找到
的
方法,创建一个自定义字段并使用以下内容:
REGEXP_EXTRACT
:[^\\|]*_){0}([^\\|]*)') 这将返回第一个
值
。但是,我不能这样做来返回
值
2或
值
3,等等。这不起作用:
REGEXP_EXTRACT
(Event Label,
浏览 41
提问于2021-07-14
得票数 0
1
回答
如何根据
字符串
列表过滤列
值
、
我正在尝试通过将
字符串
列表与列
值
进行比较来筛选
数据
集。 使用"LIKE“和一个
字符串
,使用3 3GB,效果很好。(
REGEXP_EXTRACT
(GCAM, r'c12.1:(\d+)') as FLOAT64)) sum(SAFE_CAST(
REGEXP_EXTRACT
(GCAMAND TIMESTAMP('2019- AND V2Themes LIKE 'ECON_INFL
浏览 22
提问于2019-09-12
得票数 0
回答已采纳
1
回答
使用
REGEXP_EXTRACT
没有给出预期
的
结果-- Hive
、
、
我试图在Hive中使用
REGEXP_EXTRACT
函数从列
中
获取所需
的
字符串
。列
中
的
数据
以下列形式显示:我需要在\之后提取
字符串
的
部分。我试着做这样
的
事:SEL
浏览 1
提问于2018-01-09
得票数 1
回答已采纳
1
回答
获取
字符串
中
给定键
的
值
的
单元查询
、
、
我使用
regexp_extract
从
字符串
中
获取子
字符串
。我
的
字符串
是":abd: 576892034 :erg: 94856023MXCI :oute:一个RF WERS YUT :oowpo: 649217349GBT“ 如何使用
regexp_extract
如果将键作为、abd、传递给、abd、,则需要作为576892034
的
值
,任何其他函数也可以。
浏览 1
提问于2021-06-22
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券