是否可以搜索一系列单词并提取下一个单词。例如,在txt文件中,搜索单词'Test‘,然后直接返回该单词?
Test.txt
This is a test to test the function of the python code in the test environ_ment
我希望得到结果:
to, the, environ_ment
我想要匹配所有包含字母‘a’,‘e’,‘i’,‘o’和‘u’的英文单词,并且按该顺序匹配一次,并且不匹配语料库中的任何其他英语单词。到目前为止,我可以从语料库中找到所有a,e,i,o,u的单词,但有些单词的元音出现了不止一次,例如,我得到的结果是'abietineous‘,而我只查找像'abstemious’这样的单词。
下面是我的代码片段。请协助修复我的RE以获得这些结果。
[w for w in wordlist if re.search('[a].* [e].* [i].* [o].* [u].', w)]
注意:我希望单词只包含a,e,i,o,u-,并且
除下列单词外,我想匹配所有单词:
1) any-random-word
2) any-random-word/
3) any-random-word/123
4) any-random-word/abcdef
这样跟随类似的词就可以匹配了。
1) any-random-word123
2) any-random-word(any non-word character other than '/')123
2) any-random-wordabcdef
4) any-random-word(any non-word character other than '/&
我正试图在我的应用程序中创建一个正则表达式,并且很难理解它。我已经创建了一个正则表达式,但我仍然希望修改它,使其不匹配特定的内容。我需要为iOS和Android创建regex。
这是我的领地
(?:rahul[\s"'?.!:s()\{\}])
这是我的测试字符串
rahul hello rahul! vyas and rahul? and rahul. and rahul: and rahul and rahul( and rahul) and rahul{ rahul.shiv rahuls vyas rips rahul!!
这是我用来创建regex 的站点
我真正想要
我一直在使用单词边界来查找字符串中的确切单词,但我刚刚了解到它们忽略了非单词字符。
因此,当我在字符串"height (in stories)“中查找"height”时,我得到了预期的结果:
p = re.compile(r'\b%s\b' % 'height')
p.search('height (in stories)') # match
但是当我在字符串"height (in stories)“中查找"height (in stories)”时,我得不到匹配:
p = re.compile(r'\b%
我们已经编写了一些错误的代码,在对象属性名称中有一个多余的单词,我们试图使用搜索和替换在整个应用程序中找到这些罪魁祸首。
举个例子,假设一个person对象的属性也包含单词person,即
var person = new Person();
person.personName = 'Mark';
person.personAge = 20;
在本例中,我们知道单词person,但不知道在整个应用程序中对该对象设置的所有属性。
使用Regex,我们是否能够找到任何匹配的person*,其中通配符总是大写字母,即camelCase?我们希望将personName替换为name。
假设我想编写一个正则表达式,将单词Dog替换为单词Cat。
例如:
Dogs are scary.
将成为:
Cats are scary.
但我希望仅当单词Dog不在引号内时才应用此正则表达式。
例如:
Dogs are scary but my mom told me that "Dogs are cute"
将成为:
Cats are scary but my mom told me that "Dogs are cute"
我不知道该怎么做。请帮帮我:)
我有下面的代码,它可以从存在某个单词的文本中返回一行
with open('/Users/Statistical_NLP/Project/text.txt') as f:
haystack = f.read()
with open('/Users/Statistical_NLP/Project/test.txt') as f:
for line in f:
needle = line.strip()
pattern = '^.*{}.*$'.format(re.escape(needle))
我有一个存储用户输入的字符串数组,我想检查输入的用户是否只包含特定的单词结束,我不介意在单词之前或单词之后是否有空格例如用户可以输入像END或“END”或" END“或”END“这样的单词。我并不关心单词之前或之后有多少空格,我只想检查输入字符串是否只包含单词END,而不考虑空格。
我试过了
Regex regex_ending_char = new Regex(@"^END|^\s+END$|^END+\s$");
// to compare the word "END" only nothing before it nor after it -
/
如果我有一个句子,我希望在一个特定的单词之前显示一个单词或所有单词,例如,我想在brown The quick brown fox jumps over the lazy dog之后显示单词fox,我知道我可以在后面看起来很积极,例如(?<=brown\s)(\w+),但是我不太了解实例(?<=\bbrown\s)(\w+)中\b的用法。我使用作为我的测试器。
我正在使用PCRE来查找短语中的所有单词对,例如。“敏捷的棕色狐狸跳过懒狗。”应该产生
The quick
quick brown
brown fox
fox jumped
jumped over
...
...
lazy dog
我使用了函数FindAndConsume(),它同时使用了两个单词,但我只得到了一半的结果!
The quick
brown fox
jumped over
...
...
the lazy
因此,我正在尝试寻找是否有一种方法来检索所有的单词对。
我有一个如下的输入字符串:
john is a StartDate 10\11\2012 EndDate 15\11\2012 john is a boy john is StartDate john
我想从上面的字符串中提取两个日期StartDate和EndDate。
但是,我不能只搜索单词StartDate,因为在字符串的末尾,StartDate可能是一个独立的单词。我不能一审,因为没有任何保证,带有日期的StartDate单词将始终是第一。
因此解决方案是一起搜索模式StartDate % EndDate %。即StartDate和EndDate单词在一起。
实现这一目标的最佳方法是什么
我有一个单词列表,比如
one
two
three
在notepad++中,如何立即将单词转换为如下字符串:
<a href="function("one");"> one </a>
<a href="function("two");"> two </a>
<a href="function("three");"> three </a>
一般来说,我对正则表达式是个新手,我开始阅读更多关于它们的内容,所以请注意:-)
我要查找所有以my("或my('开头的单词。单词本身可以包含下划线、字符、数字,基本上可以包含任何字符。但它应该以")或')结尾。
因此,我尝试了以下方法:
Pattern.compile("_(\"(.*)\")"); // for underscores first, instead of my
和
Pattern.compile("(my)(\"(.*)\")");
但这也给了我其他的东西,我看不出我为什么以及在