Python:使用正则表达式获取字符串中的未知词，并使用其边界

Python中可以使用正则表达式来获取字符串中的未知词，并使用其边界。正则表达式是一种强大的文本处理工具，可以用于匹配、查找和替换字符串。

在Python中，可以使用re模块来操作正则表达式。下面是一个示例代码，演示如何使用正则表达式获取字符串中的未知词，并使用其边界：

import re

def get_unknown_words(text):
    pattern = r'\b\w+\b'  # 匹配单词的正则表达式模式
    known_words = ['apple', 'banana', 'cat']  # 已知的单词列表

    unknown_words = []
    matches = re.findall(pattern, text)  # 查找所有匹配的单词
    for word in matches:
        if word not in known_words:
            unknown_words.append(word)

    return unknown_words

text = "I have an apple and a banana. The cat is sleeping."
unknown_words = get_unknown_words(text)
print(unknown_words)

运行以上代码，输出结果为：['an', 'and', 'The', 'is']。这些单词在已知的单词列表中不存在，因此被认为是未知词。

在上述代码中，使用了\b\w+\b作为正则表达式模式。其中，\b表示单词的边界，\w+表示匹配一个或多个字母、数字或下划线。通过re.findall()函数可以找到所有匹配的单词。

对于边界的处理，可以使用\b来匹配单词的开始和结束位置，确保获取的是完整的单词。

对于已知的单词列表，可以根据实际需求进行修改。在实际应用中，可以将已知的单词存储在数据库或文件中，并动态加载到程序中。

Python:使用正则表达式获取字符串中的未知词，并使用其边界

、、

我有以下字符串我只想获取string1的一部分：“name”。但在我的问题中，“name”并不总是相同的，在不同的字符串中。所以我需要使用正则表达式来匹配任何空格和字符串之间的单词：'.somefunction()'，但是我真的不知道如何正确地编写正则表达式<

浏览 24提问于2017-08-04得票数 0

2回答

如何在Python中实现详细的REGEX

、

我正在尝试使用Python (2.7)中的详细正则表达式。如果这很重要，我只是想让它更容易回到过去，并在未来的某个时候更清楚地理解这个表达式。因为我是新手，所以我首先创建了一个紧凑的表达式，以确保我得到了我想要的东西。test_verbose_item_pattern = re.compile('\n{1}\b?Dropbox/directEDGAR-Code-Examples/N

浏览 0提问于2012-12-13得票数 14

回答已采纳

1回答

用Java编写带边界匹配的正则表达式的最有效方法是什么？

、、、

所以我发现边界这个词很好地确保这个词在文本中被找到，如果它们只包含这个单词的一部分的话，我们不会剪其他的单词，但是我注意到它在字符串的开始和结束时是不好的。因此，理想情况下，我希望像这样的正则表达式在字符串开始和结束中也能很好地工作，因为单词也是从这里开始/结束的： String regex1 = "\\b" + searchedWo

浏览 5提问于2016-09-09得票数 1

回答已采纳

1回答

提取包含法语单词"mais“返回句的不包含的句子

、、、、

早上好, 我试图从文件中提取包含"mais“一词的句子，但我遇到的问题是，提取出来的句子根本不包含"mais”，有时包含"jamais“。你知道为什么吗？我举了一个小例子来说明我的问题？如下所示:我写的脚本使用了空格来标记句子，所以我只是举例说明了一小部分。这些行跟随读取文件并将其放入列表的行。然后在列表中循环找到包含"mais“的elt。因为我有一个很大的文

浏览 1提问于2020-05-11得票数 0

回答已采纳

3回答

搜索字符串列表，并确定在单独的字符串列表中是否存在精确匹配。巨蟒。情绪分析

、

joe', 'mauer']我如何遍历我的listOfStrings并确定它们是否包含任何keywords...Must是完全匹配的！'mauer is awesome' (因为'foobar‘与'foo’或'bar‘不完全匹配，函数只应在&#x

浏览 4提问于2013-05-13得票数 0

回答已采纳

2回答

MYSQL INET_NTOA IP地址搜索

、、

我很难理解为什么从IP地址的MySQL查询中得到以下结果。我把IP地址存储成整数。|| 168489583 |+-----------+以下是将整数转换为IP地址时数据的外观10.10.111.124 || 10.10.242.111 |5 rows in set (0.00 sec) 如果在查询中使用十进制ipaddress WHERE

浏览 3提问于2013-10-07得票数 1

回答已采纳

3回答

如何获取所有以“#”开头的术语？

、、

我有一个这样的字符串："sometext #Syrup #nshit #thebluntislit"我使用了以下代码：line = "blahblahblahthebluntislit"ht = ht.group(0)我得到了以下信息：我想知道是否有一种方法可以让我得到这

浏览 0提问于2011-12-02得票数 0

回答已采纳

3回答

如何只选择特定的单词？

使用字符串ant apple bat，我只想选择ant和bat，而不选择苹果或任何空格。我已经尝试了一些不同的东西，比如；或或或或或我知道上面的例子很愚蠢，但我只是在一个正则表达式测试器上胡闹，试图弄清楚它。我以前做过正则表达式，我弄明白了，但似乎不记得我是怎么做的。选择

浏览 2提问于2019-10-26得票数 1

2回答

Perl-regex字边界等价

、

扩展我的基本判读知识，有些事情对我来说并不清楚。/(^|\W)word(\W|$)/m #when multi-line is turned on因为\b的意思是单词边界。这个词是\w+，所以\b必须是任何不是\w

浏览 2提问于2014-09-03得票数 0

回答已采纳

2回答

我尝试在mysql中使用regex来搜索json数组字符串中的边界词，但我不希望regex匹配词的顺序，因为我不知道它们。因此，我首先在regex101 ()上编写正则表达式，然后尝试将其转换为mysql。 WHERE `Wish`.`services` REGEXP '^([^>].*[[:<:]]Hygiène[[:>:]])([^>].*[[:<:]]Andrologie[[:>:]

浏览 0提问于2019-03-24得票数 0

2回答

正则表达式中的特殊字符问题

、、、

我正试图根据被禁止的单词列表创建一个正则表达式。这将与字符串进行比较，以查找禁用的单词。不应该找到任何子词。所以我有一个字符串，我搜索它寻找一个词。然后，我使用一个单词边界来编写正则表达式，以包含所有可能的其他字符。这很有效，直到我发现需要找到一个特殊<em

浏览 1提问于2014-11-18得票数 1

回答已采纳

4回答

Flash中的正则表达式

、

我正试着在flash中写一个正则表达式，它会找到单词"ho“，但不会找到包含”ho“的单词，比如，如何，谁，想法等等…… 我并不是要求一个明确的解决方案，但如果有一个正确的方向或一个例子，我们将不胜感激

浏览 2提问于2009-09-28得票数 0

回答已采纳

6回答

Python匹配其他单词

、

我一直在尝试并寻找一个解决方案来匹配python中使用regex的所有其他单词。字符串是以未知长度分隔的逗号。假设我有以下字符串：我希望能够把所有匹配的单词作为一个列表保存下来。.*),)*result = re.match(regex, string) pri

浏览 5提问于2013-11-03得票数 0

回答已采纳

2回答

正则表达式中的意料之外的词边界行为

、、

import retempl_1 = 'washington d.c'print(re.sub(r'\b%s\b'%templ_1, '', text))print(re.sub(r'\b%s\b'%templ_2, '', text)) 我得到了washington d.c. columbia而不是. columbia

浏览 4提问于2017-06-08得票数 0

回答已采纳

4回答

使用dash时的正则表达式问题

我对正则表达式有一些问题。我正在测试wit案例1上面的表达式可以成功匹配“浇水”。但是如果我在第二种情况的中间加一个连字符：它不能与"water water-ing“中的”water-ing“相匹配。只有当我将"water-ing“表达式移到前面时，它才能起作用，如案例3所示：但我希望找出是否有任何解决方案的案

浏览 2提问于2016-05-05得票数 3

1回答

准确地从R中的字符串中匹配和计数单词的频率

、

所以我有一段这样的文字：问题：我想数一下这个词出现了多少次。

浏览 2提问于2016-05-03得票数 2

回答已采纳

3回答

表示DNA代码的字符串的正则表达式

你好，我正在尝试在java程序中使用正则表达式。我想让正则表达式识别未知长度的字符串，其字符仅为“C”、“A”、“G”或“T”。谢谢你的帮助。

浏览 0提问于2011-05-16得票数 2

回答已采纳

1回答

当字符串本身以单词边界结尾时，Ruby正则表达式匹配由word边界字符包围的字符串。

、

My：/\b+#{string}\b+/其中string = 'test-‘我想要正则表达式和test-匹配。如果我的测试字符串没有以单词边界字符结尾，这很好，但如果这样做，它就会中断。# chars也可以是任何其他单词边界字符，因此另一个示例是：反例案例，起作用： regex：/\b+#{string}\b+/，其中string = 'test

浏览 0提问于2017-03-22得票数 2

回答已采纳

1回答

Regex，使用单词边界捕获，而不停留在“点”和/或其他字符处。

、

例如，给出如下字符串：我目前正在使用这个regex来捕获用户名(bob.1234)：但是我的代码需要一个正则表达式，只有一个捕获组，因为python的re.findall在有多个捕获组时返回一些不同的内容。这样的东西几乎可以工作，但它将捕获用户名"bob“而不是"bob.1234&qu

浏览 0提问于2018-02-25得票数 1

回答已采纳

2回答

有人能解释这个正则表达式吗？

、

我偶然看到了john resig的一篇解释JavaScript继承的文章。在这篇文章中，有一个类实现代码，其中起始行有一个regexp fnTest = /xyz/.test(function(){xyz;}) ?

浏览 1提问于2013-02-13得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Python:使用正则表达式获取字符串中的未知词，并使用其边界

相关·内容

Python:使用正则表达式获取字符串中的未知词，并使用其边界

如何在Python中实现详细的REGEX

用Java编写带边界匹配的正则表达式的最有效方法是什么？

提取包含法语单词"mais“返回句的不包含的句子

搜索字符串列表，并确定在单独的字符串列表中是否存在精确匹配。巨蟒。情绪分析

MYSQL INET_NTOA IP地址搜索

如何获取所有以“#”开头的术语？

如何只选择特定的单词？

Perl-regex字边界等价

MYSQL REGEX搜索多个没有排序条件的单词

正则表达式中的特殊字符问题

Flash中的正则表达式

Python匹配其他单词

正则表达式中的意料之外的词边界行为

使用dash时的正则表达式问题

准确地从R中的字符串中匹配和计数单词的频率

表示DNA代码的字符串的正则表达式

当字符串本身以单词边界结尾时，Ruby正则表达式匹配由word边界字符包围的字符串。

Regex，使用单词边界捕获，而不停留在“点”和/或其他字符处。

有人能解释这个正则表达式吗？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐