我用Python编写了以下代码:
import re
string = "what are you doing you i just said hello guys"
regexValue = re.compile(r'(\s\w\w\w\s)')
mo = regexValue.findall(string)
我的目标是找到任何3个字母的单词,但由于某种原因,我似乎只找到了"are“,而没有在我的列表中找到"you”。我想这可能是因为两者之间的空间是重叠的,既然这个空间已经被使用了,它就不可能是“你”的一部分。那么,我应该如何从这样的字符串中只
我有一个列表,例如:
Type [data]
Device Type [data]
Pin type [data]
我尝试只搜索Type数据,而不是Device Type或Pin Type。请注意数据文本根据列表的不同而变化。
我当前的代码:
result = Regex.IsMatch(line1, "\\bType\\b");
我做错了什么?
我正在尝试从一个文本文件中创建一个列表,这个文本文件是我正在读入Python中的。文本文件在整个文件中包含一串方括号--这里有一些文本。我要做的是先数一下我有多少个方括号对,然后把它们里面的任何文本加到一个列表中。
下面是我试图在括号中使用的文本文件的超级简化版本:
"[name] is going to the store! It's going to be at [place] on [day-of-the-week]."
以下是我所拥有的:
bracket_counter = 0
file_name = "example.txt"
readFil
我正在尝试创建一个函数,允许用户从文本文件中搜索关键字或短语,并将该文本文件中包含此关键字的所有行插入到列表框中。我有一个标签为SearchE的输入框中的用户输入,并希望将文本文件中包含存储在SearchE下的值的所有行插入列表框。我已经将我的文本文件转换为列表(mylist),因为我发现这有助于在访问文本文件时使用其他功能。我不知道如何将文本文件中条目的所有匹配项插入到列表框中。
for SearchE.get() in mylist:
listbox.insert(END, SearchE.get())
dave = [m.start() for m in re.finditer('*', "2345234*265354*26342567*356")]
print(dave)
每当我运行这段代码时,它都会给我一个巨大的错误。
Traceback (most recent call last):
File "C:\Users\Max\Desktop\MaxsCal V.1.py", line 107, in <module>
dave = [m.start() for m in re.finditer('*', "
我必须编写一个python脚本来解析日志文本文件,但唯一感兴趣的数据是正在检查的"Test“的数据。文本文件的一般格式如下:
Test 1
[lines of data]
Test 2
[lines of data]
...
数据行表示来自所述测试的多行或几行数据,并且日志文件可以具有任意数量的测试。因此,如果我只想查看“测试1",我希望我的脚本提取”测试1“和”测试2“之间的所有信息,但让它在”测试2“之前停止读取。
问题是,我希望我的脚本做同样的事情,即使我希望解析来自测试12的数据,并在测试13之前停止它,因为在该文件中可以有任意数量的测试。我该怎么做呢?
我正在寻找一个HTML页面内的重复模式。
我感兴趣的模式从前缀"Seasons“开始
同样的模式也出现在前缀之前,我对这些不感兴趣。
我尝试使用以下python代码(我将模式简化为“<a href=.+?”为了使这个问题具有可读性):
matches = re.compile('<h2>Seasons</h2>.+?(<a href=.+?</a>)+',re.DOTALL).findall(page)
for ref in matches
print ref
给定页面:
blah blah html stu
我正在使用Python Paramiko模块sftp到我的一台服务器。我执行了一个list_dir()来获取文件夹中的所有文件。在文件夹之外,我想使用正则表达式来查找匹配的模式,然后打印出整个字符串。
List_dir将以这种格式列出XML文件的列表
LOG_MMDDYYYY_HHMM.XML
LOG_07202018_2018 --> this is for the date 07/20/2018 at the time 20:18
我想使用regex来归档那个特定日期的所有XML文件,并将它们存储到一个列表或一个变量中。然后,我可以将这个变量传递给Paramiko以获取该文件。
我有一个很长的短字符串列表,我想在(通常)长文本字符串中搜索所有这些项目。我的列表有大约500个短字符串,我希望使用python查找大约10,000个字符长度的源文本中出现的所有内容。
下面是我的问题的一个简短示例:
cleanText = "four score and seven years ago our fathers brought forth on this continent a new nation conceived in Liberty and dedicated to the proposition that all men are created equal
我正在尝试匹配使用Python的所有不以散列表开头的单词。
例句:
This is #a test for #matching #hashtags
我希望匹配以下内容:这是对
我能够将以散列表开头的所有单词匹配如下:#\b\w*
然后我意识到我需要相反的东西。
我尝试了许多类似的变体,但都没有成功:
^(?#\b\w*)
^(?!#)\w+$
^(?!#).*
/(\s\S*?)(#)
^(?:(?!#))*$
毫无办法。
我想要匹配"stackoverflow“中存储在变量x中的"stackover”,
使用perl,我可以这样做:
$x = "stackover";
$y = "stackoverflow";
if ($y =~ /^$x/){
print "success";
}
我如何在python中做到这一点,我不能在regex中有x变量。
reg = re.compile("x") # this will match x instead of matching stackover
谢谢
我有一个我写的python脚本的输出,它由从一个大数据集中提取的文本的一部分组成,在通过正则表达式匹配一些模式之后。
为了直观起见,我想使用MS Word在文本的这些部分中突出显示这些模式,并且我尝试使用脚本中使用的相同正则表达式来查找/替换,但没有成功。
示例:我想找出文本中出现的每一个模式work (?:\w+ )?(?:\w+ )? children,即最多允许work和children之间的任何其他两个单词
"[...] ability to work with children must be proven. Social Worker Job Essex Our Essex
有没有办法修复下面的正则表达式?我在regex101中包含了一个示例。基本上,它捕获了太多的()[]标记之间的错误部分。它做了它应该做的事情,但反过来我丢失了文本和另一个标记。 https://regex101.com/r/OPRCuh/1 正则表达式: \[(.+?)\]\((https.+?)\) 示例文本 _“[Developer Interview](/blog/tags/developer_interview.html)” is a new series here at Semaphore blog. We’ll interview developers from some of
我有以下代码,其中frag是被切割(按顺序) DNA序列数据的字符串列表:
for a in frag:
length_fragment = len(a)
if (a[0:5] == 'CCAGC') and (a[-1:] == 'C'):
total_length.append(length_fragment)
然而,我想跳到for循环中的下一个a,看看下一个片段的第一个字母是否是CCAGC……这是不是可以在python中实现。
所以我想把a-1:=='C‘改为下一个a0:5 =='ACGAG’
我有一个包含800个元素的列表,我要在大约50k个文件中查找,每个文件大约50行。(这些是具有非泛型名称的xml标记-搜索很简单,所以我没有使用Beautiful soup。)
每次找到一个元素时,800个元素的列表就会缩短。
遍历文件,
对于所有可能的元素(检查行中的“-checking”、"rover“、"fido”等),首先检查哪一行有关系吗?或者一次检查所有行中的一个元素(例如,检查文件中所有行的"spot",然后检查所有行的"rover",等等)?
或者所有这些都是低效的?(这是使用python。)我在想:
for line in so
假设我在一个文本文件中有一个足球俱乐部名称列表,每行一个名称。
Arsenal
Manchester United
Chelsea
Liverpool
...
...
Manchester City
Real Madrid
假设我需要找到以“曼彻斯特”开头的行,我有下面的正则表达式。
Pattern clubman = Pattern.compile("Manchester.*");
Matcher matche = clubman.matcher(fileString);
if (matche.find()) {
System.out
我是python的新手。 我有一个这样的字符串和列表 s='''Hello, Carry out the item with care
Louis, MS to Dallas, TX ''' LOC=['Dallas','Louis'] 如何根据字符串中单词的出现情况对列表进行排序? 所需输出: LOC =['Louis','Dallas'] 考虑到列表中的单词在字符串中不会重复多次。
因此,在我的Python脚本中,我打开了一个文本文件,其中包含的日期格式为“1991年1月26日”
下面是我的正则表达式:
pattern = """
(?:(September|April|June|November),\ (0?[1-9]|[12]\d|30),\ ((?:19|20)\d\d))#Months with 30 days
|(?:(January|March|May|July|August|October|December),\ (0?[1-9]|[12]\d|3[01]),\ ((?:19|20)\d\d))#Months with 31 da
我尝试了很多方法,但都不能解决问题。
我正在尝试清理我的Emulators游戏列表。
下面是它看起来的样子:
1943 Kai: Midway Kaisen (Japan)
1943: Battle of Midway (bootleg, hack of Japan set)
1943: Midway Kaisen (Japan)
1943: Midway Kaisen (Japan, Rev B)
1943: The Battle of Midway (Euro)
1943: The Battle of Midway (US, Rev C)
1944: The Loop Mast