我有一个正则表达式,它可以实现我想要的结果:\.?(\w+[\s|,]{1,}\w+[\s|,]{1,}\w+){1}\.?
这意味着它捕捉了一行中除了空格和逗号之外没有任何分隔的三个单词的事件(所以只有句子的一部分)。然而,我想要这个匹配每一个三个字的例子在一个句子。
所以在这个极端简单的例子中:
Hi this is Bob.
应该有两个捕获-“嗨,这是”和“这是鲍勃”。我似乎不知道如何让regex引擎以这种方式解析整个语句。有什么想法吗?
我有一个字符串中的SQL查询,它是动态构建的。有时它会以"1000M"的形式包含小数点。
M总是大写的。因此,字符串可能如下所示:
"3 sql stmts here 10009M some other 3 sql stmts here"
我想知道是否有可能可靠和一致地删除M。所以字符串看起来是这样的:
"3 sql stmts here 10009 some other 3 sql stmts here"
我开始考虑regex:
[0-9][M]
这将与M和M本身之前的数字匹配。
我想知道它是否可能使用regex,除非有更好的方法
我正在寻找Vc在文本中的表达方式,为此我有
rex = r"(\(?)(?<!([A-Za-z0-9]))[A-Z][a-z](?!([A-Za-z0-9]))(\)?)"
说明:
[A-Z][a-z] = Cap followed by lower case letter
(?<!([A-Za-z0-9])) -> lookbehind not being a letter or number
(?!([A-Za-z0-9]))(\)?) _ Look ahead not being letter or number
# all that optional
嗨,我正在写一个简单的BASH,以删除段落中任何单词的连续重复出现,用单个空格分隔,并将输出重定向到stdout,这里是我取得的进展。
file1
**double double toil and trouble
fire burn and cauldron bubble bubble
tomorrow and tomorrow and tomorrow
creeps in this this petty pace from day toto day**
echo `<file1` | sed -e 's/\b\([a-z ]\+\)\1/\1/g' |
我有以下案文:
SELECT
U_ArrObjJson(
s."Description", s."DateStart", sp.*
) as "Result"
FROM "Supplier" s
OUTER APPLY(
SELECT
U_ArrObjJson,
'U_ArrObjJson(',
' <- THE PROBLEM IS
我正在寻找一个C#正则表达式解决方案来匹配/捕获一些小但复杂的数据块。我的数据库中有数以千计的非结构化数据块(来自第三方数据存储),这些数据看起来类似于以下内容:
not BATTCOMPAR{275} and FORKCARRIA{ForkSpreader} and SIDESHIFT{WithSSPassAttachCenterLine} and TILTANGLE{4up_2down} and not AUTOMATSS{true} and not FORKLASGUI{true} and not FORKCAMSYS{true} and OKED{true}
我希望能够将其分割成离散的
我有以下字符串:
"useless text $TABLE[1]$ other useless text $TABLE[2]$ useless text..."
我想用类似于"< table id='x'>“之类的东西替换子字符串"$TABLEx$”的出现。因此,我需要从字符串中取回id,并将其插入到替换字符串中,这将用于所有出现的事件。
就像这样:
text = text.replace("$TABLE_[x]$", "<table id='x'>");
我松散地遵循一个把手模式来替换字符串中的{{copy}}表达式的实例。
下面是我试图匹配的字符串/场景的一些示例:
{{copy}}
some text, then {{copy}}, then some other other text
some {{copy 'default value here'}} here
本质上,{{copy}}可以出现在字符串中的任何地方,也可以包含一个默认值,我也需要使用regex提取这个默认值。
我试过以下几种我认为会匹配的,但没有运气。
\b{{copy*}}\b
是否有一种方法来匹配独特的字符组(在下面的情况下)的出现顺序,纯粹的正则表达式?如果是这样的话,这个表达式在效率上如何与非正则解相比?我正在使用Python的风格,但我也会对任何其他风格的解决方案感兴趣。
这是一个示例案例:
string = 'the floodwaters are rising along the coast'
unique = ['the', 'floadwaters', 'are', 'rising', 'along', 'coast']
在Python混合解
我想使用python将任何一个数字替换为相同的数字,然后加上标点符号(逗号)。
text = 'I am going at 5pm to type 3 and the 9 later'
我想把这个转换成
text = 'I am going at 5pm to type 3, and the 9, later'
我的尝试:
match = re.search('\s\d{1}\s', x)
我可以检测到它们,但现在不能用相同的数字替换,后面是逗号。
我有一只熊猫数据,我想在一列中替换某些字符串。字符串可能是这样的:“蜘蛛侠是Nr 1”,我想把它变成“蜘蛛侠(Nr 1)”,字符串中唯一保持不变的部分是"is Nr“。超级英雄和数字变化,但并不是每个超级英雄都有一个数字给他们。所以数据可能是这样的:
Superheros
Spiderman is Nr 1
Batman is Nr 4
Joker
Iron Man is Nr 2
Hulk
Captain America
Wonderwoman is Nr 3
我想更改这个Dataframe,以便将所有是Nr \d的内容更改为(Nr \d):
Superheros
Spiderman
我有下面的文字
1. This is 678 897 999
not a text which I want
2. This is 678 897 879
我已经申请了regex
This\s*is\s*(\s+\d+){1,}(?: ){0,}[\r\n]+
现在我想要的是匹配一个没有的字符串,而不是匹配字符串旁边的。我不想让正则表达式匹配第一个字符串。
编辑
假设上面有两个字符串,然后应用regex,我找到了两个匹配的字符串。
This is
我有一段代码,用于提取正则表达式中重复的:分隔部分,这不能给出正确的输出。
val pattern = """([a-zA-Z]+)(:([a-zA-Z]+))*""".r
for (p <- pattern findAllIn "it:is:very:great just:because:it is") p match {
case pattern("it", pattern(is, pattern(very, great))) => println("it: "+ is