在我看来,\w与[a-zA-Z0-9_]匹配有点奇怪。我想知道为什么0-9和_在单词字符之间被计算,为什么在单词字符之间不计算-。
如果我想分两句:
This is counter-example.
使用(\w*\b),它将单词反例分成两部分。类似地,(count.*?\b)只匹配counter。
是否有可能出现类似于\b的结果,即-包含在单词字符(\w)中?
还是我误解了\b的用法?有一些标准用法的例子吗?
编写一个名为getWords(sentence, letter)的函数,它接受一个句子和一个字母,并返回以该字母开头或结尾的单词列表,但无论字母大小写如何,都不能同时返回。
例如:
>>> s = "The TART program runs on Tuesdays and Thursdays, but it does not start until next week."
>>> getWords(s, "t")
['The', 'Tuesdays', 'Thursdays',
我最近开始研究正则表达式的东西。有件事真的让我很困扰。
如果后面没有特定的符号,如何将正则表达式设置为仅匹配特定的单词。例如,假设我有一个文本,其中包含一些普通单词,以及一些以大写字母结尾的单词。如果一个单词后面没有大写字母,我如何才能让我的正则表达式只检测这个单词呢?
Just some sample texT with wordS. ThiS should be Matched.
因此,我希望我的reggex能够匹配除"texT,words和ThiS“之外的所有单词。
提前感谢您的帮助:)
我必须用python来完成这个任务:选择数据框架列中不包含一个或多个字母、空格和句点的所有单词。我尝试了这段代码,但它告诉我模式是不正确的:
import re
countries = gapminder['country']
# Pattern that contains all words that do not satisfied the specification
pattern = re.compile('[a-zA-Z \.]+')
mask = countries.str.contains(pattern)
# Select the complem
我想要一个正则表达式,只有在后面和后面的单词只有字母的时候才能找到破折号(这样我就可以用空格代替那些破折号了)。因此,例如,我不想在产品代码的中间放一个空格(可能包含一些特殊的字符或数字)。
我怎样才能找到分隔只包含字母的单词的所有连字符?
no- -no 00-00 no 0-no no-0 0nono-nono0 yes-yes yes-yes-yes
x x x x x x ^ ^ ^
企图:
\b(?<!([\d\W]))-(?!([\d\W]))\b
谢谢!
我必须在pl/sql中找到字符串在较大字符串中的位置。
让我们说,字符串是:‘所有最好的,最好的’,我必须得到字符串的位置“,只有当它是一个单独的词,而不是字符串的一部分。在上述情况下," the“一词的位置应为16,对应于”无用功“字,而不是”4“。不应考虑"allthebest”中" the“一词的出现。
试过这个:
select regexp_instr('allthebest all the best',' the ') from dual;
当然,当前面有一个空格,在单词" the“后面有一个空格,它就会起作用。但是,如
有人能帮我一下吗?
s_test = "this is a test string this is a test string "
function String.Wholefind(Search_string, Word)
_, F_result = string.gsub(Search_string, '%f[%a]'..Word..'%f[%A]',"")
return F_result
end
A_test = String.Wholefind(s_test,"string")
output: A_
我正在尝试匹配不在< >中的单词。
这是< >中匹配单词的正则表达式。
text = " Hi <how> is <everything> going"
pattern_neg = r'<([A-Za-z0-9_\./\\-]*)>'
m = re.findall(pattern_neg, text)
# m is ['how', 'everything']
我希望结果是['Hi', 'is', 'going']。
我想在下面的tweet中检查#python和#conf标签是否都存在:
tweets = ['conferences you would like to attend #python #conf',
'conferences you would like to attend #conf #python']
我试过下面的代码,但它与tweet不匹配。
import re
for tweet in tweets:
if re.search(r'^(?=.*\b#python\b)(?=.*\b#conf\b).*$', t
我得出了这样的结论,就像在下面的例子中一样,我不明白为什么它在第一种情况下扫描,在第二种情况下寻找。我理解了第三种情况。
SELECT c.contactname FROM Sales.Customers c
WHERE c.contactname LIKE '%a'-- Does a Scan 1st Case
SELECT c.contactname FROM Sales.Customers c
WHERE c.contactname LIKE 'a%'-- Does a Seek 2nd Case
SELECT c.contactname FROM S
我正在学习sed命令。我写了一个命令,用大写字母代替单词的第一个字母:
sed -e "s/\b\(.\)/\u\1/g"
但我不知道如何找出所有单词都以大写字母开头的行。
例如,我的文本文件:
Hello world
Hello World
Lorem Ipsum sample
该命令应该返回一行:
Hello World
我试图使用re.finditer获取字符串中一个单词的开始和停止索引号。在大多数情况下,我的模式工作得很好,但对于一个具有特殊字符的词,我的准则给了我一个错误。
问题:
我试过:
a = " we have c++ and c#"
pattern = ['c#','c++']
regex = re.compile(r'\b(' + '|'.join(pattern) + r')\b')
out = [ (m.start(0), m.end(0)) for m in regex.finditer(a)
我很好奇是否有办法自己找到一个准确的单词,即使搜索是在一个单词中完成的。正如您在下面看到的,输出表明“day”一词被发现了两次,但这仅仅是因为“day”也用于拼写“今天”。我希望搜索特别寻找‘天’这个词,并计数,即使它是在‘今天’。
这个是可能的吗?
注意:任务希望我们使用字符串操作器
//search for particular word - member function
std::cout << "Please indicate a word which you like to be found in the paragraph you entered: "
我正在努力拒绝匹配由换行符分隔的单词。
下面是测试字符串:
Cardoza Fred
Catto, Philipa
Duncan, Jean
Jerry Smith
and
but
and
Andrew
Red
Abcd
DDDD
正则表达式的规则:
1)如果一个单词后面有逗号,就拒绝它。因此,我们将放弃卡托。
2)只选择以大写字母开头的单词。因此,and等将被删除
3)如果该词后面跟着回车(即它是名字,则忽略它)。
以下是我的尝试:\b([A-Z][a-z]+)\s(?!\n)
解释:
\b #start at a word boundary
([A-Z]
我想查询我的数据库,以获得姓名字符串中同时包含字符a和b的雇员的姓名。
我尝试了下面的SQL查询,但它没有返回与我上面所述的条件匹配的所有名称。如何更改它以返回我想要的名称?
select FName
from Employee
where FName like '%a' AND FName like '%b'
我有一个包含单词和输入字段的表,可以使用实时搜索搜索该表。目前,我使用以下查询搜索表:
SELECT word FROM words WHERE word LIKE '%searchstring%' ORDER BY word ASC
是否有一种方法来排序结果,以便在单词开头找到字符串的位置优先,在单词后面出现字符串的地方排在最后?
例如:搜索“hab”当前返回
a字母表
h abit
r ehab
但我想这样做:
hab it (第一个原因是'hab‘是开始)
alp hab et (第二个原因是'hab‘在单词的中间)
hab
我有一个长的文本文件,有超过24,000行。我需要搜索83个不同的单词,并删除这83个单词的所有实例时,这些词单独出现在一行(见下面的例子)。这些话将被删除。但搜索必须忽略:
所有只有大写文本的行
所有以§符号开头的行(不管行的其余部分是大写字母还是小写字母)。
示例
§History of TIME
HISTORY OF TIME
of
Future
Past
Of
Many Of
Official
Officer
North of the town
I am one of them
如果我搜索Of,那么在上面只突出显示第三行和第六行。
第一行不会突出显示,因为它以§开头。
我正在开发一个验证用户输入的函数,当我的代码运行时,它会检查格式,如果用户只输入字母或数字,则正则表达式可以工作。但是,如果用户输入单词和字母的组合,则输出应为“正确格式”,而输出应为“不正确的格式”。
function nameValidation(){
// Grabs name from the input box.
var name = document.getElementById('name').value;
var format = /[^0-9]+/g;
var match = format.test(name);