文章/答案/技术大牛

发布

社区首页 >问答首页 >在子字符串上匹配Regex并在特定分隔符之间返回字符串

问在子字符串上匹配Regex并在特定分隔符之间返回字符串
EN

Stack Overflow用户

提问于 2018-06-20 21:10:35

回答 1查看 51关注 0票数 2

假设我有一个字符串，可以用几种不同的方式格式化，例如：

语言：(ruby和python)角色：(软件工程师或数据科学家)
角色：(软件工程师或数据科学家)语言：(ruby和python)
语言：‘python’角色：‘软件工程师’“
语言：(ruby和python)角色：(软件工程师或数据科学家)
语言：‘python’角色：‘软件工程师’“
“语言：‘python’

我想解析这个字符串，确定字符串中是否存在role:，然后捕获任何与“角色”相关的单词，不包括那些没有包装在“)”或“'”中的单词.因此，在本例中，"languages:'python'role:'software engineer'"将返回“软件工程师”，而"role:(software engineer or data scientist) languages:(ruby AND python)"将返回“软件工程师或数据科学家”。

有什么方法可以用像单词边界这样的东西来做吗？具体来说，在role:上匹配后的区域将用引号或()分隔。

ruby

regex

delimiter

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-06-20 21:35:13

你可以用

s.scan(/role:(?:\(\K[^()]+(?=\))|'\K[^']+(?='))/)

见regex演示

详细信息

role: -一个文字子字符串
(?: -交替非捕获组的开始：
- \( -a ( char
- \K - https://www.regular-expressions.info/keep.html丢弃到目前为止匹配的文本
- [^()]+ - 1+字符( (和)除外)
- (?=\)) -a )应跟随当前位置

| -或
' -a ' char
\K -匹配重置操作符丢弃到目前为止匹配的文本
[^']+ - 1+字符( '除外)
(?=') -必须马上在右边有' char
) -交替组的末端。

注意:如果您不关心是否存在)或尾随'，请移除外观以简化正则表达式。

Ruby演示

s  = "languages:(ruby AND python) role:(software engineer or data scientist) role:(software engineer or data scientist) languages:(ruby AND python) languages:'python' role:'software engineer'  languages:(ruby AND python)role:(software engineer or data scientist) languages:'python'role:'software engineer' languages:'python'"
puts s.scan(/role:(?:\(\K[^()]+(?=\))|'\K[^']+(?='))/)

输出：

software engineer or data scientist
software engineer or data scientist
software engineer
software engineer or data scientist
software engineer

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50957067

复制

相似问题

问在子字符串上匹配Regex并在特定分隔符之间返回字符串
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在子字符串上匹配Regex并在特定分隔符之间返回字符串EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在子字符串上匹配Regex并在特定分隔符之间返回字符串
EN