首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Regex用于使用可选分隔符(char)拆分字符串。

Regex用于使用可选分隔符(char)拆分字符串。
EN

Stack Overflow用户
提问于 2021-09-26 22:33:57
回答 3查看 121关注 0票数 0

我有一个看起来像这样的字符串: new_tt_j1213。

我需要把它分成'new','tt',‘j 1213’。

字符串规则:

  1. 前三个字符总是字母

  1. 在第一个'_‘之后(如果它存在的话),只有两个字母只有

  1. 在第二个'_‘之后(如果它存在的话),有t1524或t014格式(第一个符号总是一个字母,可以有3或4个数字)

  1. 所有字母都是小写的

  1. '_‘可能因腐败而丢失

使用拆分()方法非常容易,但由于数据损坏,有时缺少第一个下划线:'newtt_j1213‘

由于我对Regex非常陌生,您能帮我调整下面的代码吗?即使没有第一个'_‘,拆分也能像前面描述的那样工作。(甚至没有第二个下划线)?

代码语言:javascript
运行
复制
 p1 =''
 p2 =''
 p3 =''

str_t = 'newtt_j123'
str_t1 = 'new_tt_j1213'
str_t2 = 'newttj1213'
str3 = 'new_ttj1213'

#   Test for data Corruption
 tr_lst = re.split('_', str_t)   
 if len(tr_lst) <3: print('DATA CORRUPTION - ',tr_lst)     
    
 p1, p2, p3 = re.split('_', str_t) # THIS LINE NEEDS ADJUSTMENT (REGEX?)
 print(p1, p2, p3, str_t)

谢谢你!!

EN

Stack Overflow用户

回答已采纳

发布于 2021-09-26 23:29:25

据我所知,你可以不用regex就能做到。

首先,删除所有_ (如果有s.replace('_', '') ),然后使用括号提取如下所示:

代码语言:javascript
运行
复制
s = "newtt_j1213"
s = s.replace('_', '')
ss = [ s[0:3], s[3:5], s[5:] ]
print(ss)

输出:['new', 'tt', 'j1213']

票数 1
EN
查看全部 3 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69339477

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档