Python Regex:在稍微相似的文本上查找匹配项，并返回字典(或字典列表)

Python Regex是Python中的正则表达式模块，用于在文本中查找匹配项。正则表达式是一种强大的模式匹配工具，可以用于在字符串中搜索、替换、分割等操作。

使用Python Regex可以实现在稍微相似的文本上查找匹配项，并返回字典或字典列表。下面是一个示例代码：

import re

def find_matches(text):
    pattern = r'(\w+): (\w+)'
    matches = re.findall(pattern, text)
    
    result = []
    for match in matches:
        result.append({match[0]: match[1]})
    
    return result

text = "name: John, age: 25, city: New York"
matches = find_matches(text)
print(matches)

上述代码中，我们定义了一个正则表达式模式(\w+): (\w+)，该模式用于匹配形如key: value的文本。然后使用re.findall()函数在文本中查找所有匹配项，并将结果存储在列表matches中。

接着，我们遍历matches列表，将每个匹配项转换为字典，并添加到结果列表result中。

最后，我们返回结果列表result，其中包含了所有匹配项的字典。

这样，对于输入的文本"name: John, age: 25, city: New York"，函数将返回一个包含三个字典的列表，每个字典表示一个匹配项，例如[{'name': 'John'}, {'age': '25'}, {'city': 'New York'}]。

推荐的腾讯云相关产品：腾讯云函数（云函数是一种事件驱动的无服务器计算服务，可以在云端运行代码），产品介绍链接地址：https://cloud.tencent.com/product/scf

页面内容是否对你有帮助？

有帮助

没帮助

Python Regex:在稍微相似的文本上查找匹配项，并返回字典(或字典列表)

、、

我尝试在几个文档中查找匹配项，并将它们作为字典(或字典列表)返回。此外，我还没有做到这一点，但是在我找到所有元素之后，我该如何处理具有多个元素的文档将返回两个值到同一个键的事实？如何更新我的词典？

浏览 11提问于2019-01-24得票数 0

19回答

使用正则表达式的哈希表/字典/映射查找

、、、

我正在尝试弄清楚是否有一种合理有效的方法来在字典(或散列、映射或其他您喜欢的语言所称的)中执行查找，其中键是正则表达式，字符串是根据键集进行查找的。我可以想出一种天真的方法来实现这一点，在这种方法中，我迭代字典中的所有键，并尝试将传入的字符串与它们进行匹配，但随后我失去了散列映射的O(1)查找时间，取而代之的是O(n)，其中n是字典中的键数。这可能是一个大问题，因为我预计这个字典会

浏览 74提问于2008-11-03得票数 21

回答已采纳

2回答

在python中匹配regex并返回键

、、、

我有一个嵌套字典，在匹配正则表达式与字典中的值时遇到了困难。我需要在字典中迭代值，并返回regex在值中匹配的键。迭代字典的值，并找到匹配项，并返回一个匹配所在的键。].values():从嵌套字典中得到一个值。那么，是否有

浏览 0提问于2019-08-19得票数 0

回答已采纳

1回答

Python:从文本文件中提取哈希标签

、

因此，我编写了下面的代码来提取hashtag和带有“@”的标记，然后将它们附加到列表中并按降序排序。问题是，文本可能没有完全格式化，并且在每个单独的散列标记之间没有空格，并且可能会出现以下问题--因为它可能会在for循环中使用#print语句检查：#socality#thisismycommunity

浏览 0提问于2018-02-05得票数 4

回答已采纳

4回答

将未知单词解析为已知单词的有效方法？

、、、、

我正在设计一个文本处理程序，将生成一个长的分项文本文档的关键字列表，并结合意义相似的单词的条目。有一些指标，但是我有一个新的问题来处理我正在使用的字典中没有的单词。我目前正在使用nltk和python，但我在这里遇到的问题要抽象得多。给定一个字典中没有的单词，将其解析为字典中的单词的有效方法是什么？我目前唯一的解决方案是浏览字典中的单词，并选择与输入单词具有最短Levenshtei

浏览 3提问于2012-06-14得票数 3

回答已采纳

1回答

使用difflib查找单词字典

、

基本上，我有一个技术术语列表，我将其添加到标准Unix字典(/usr/share/dict/words)中，并将其存储在我称为dictionaryFile.py的文件中。我有另一个名为stringSim.py的脚本，在该脚本中导入字典并对其测试示例字符串：import difflibfrom dictionaryFile"Possible Matches"

浏览 0提问于2014-05-16得票数 4

2回答

从Python中编译的regex中提取命名组正则表达式模式

、、

我在Python中有一个regex，它包含几个命名的组。然而，如果之前的组已经匹配，那么匹配一个组的模式可能会丢失，因为重叠似乎是不允许的。*BBB))') print(x)[('AAA', '')] “long”组找不到匹配项，因为“AAA”在查找前一个“short”组的匹配项</

浏览 6提问于2018-02-19得票数 7

回答已采纳

1回答

用re替换文件中的单词

我有一个函数，它在文本文件上迭代，将单词与字典中的键匹配，并将这些单词更改为键值： operators = {'order': '"ordertext_file = open(text, 'w') text_file.close() TypeError

浏览 0提问于2018-11-06得票数 0

回答已采纳

1回答

T-SQL确定字符串文本中的名词和动词

、、、、

用户有一些功能，可以在其中输入短语，然后对文本进行数据库搜索。更新:虽然我不做名词/动词/词类查找，但我目前使用的字典/短语查找方法是基于关键字的，并执行以下操作.对于那些候选人，我做了

浏览 1提问于2016-02-12得票数 1

回答已采纳

2回答

如何从我从Monkeylearn获得的API响应的python子列表中仅提取特定值

、、、、

我一直在Monkeylearn中训练一个文本分类模型，作为对API查询的响应，我得到了一个python列表。我只想从中提取特定的文本分类值。附加下面的代码。ml = MonkeyLearn('42b2344587')model_id = 'cl7C' resultFalse, 'classifications': [{

浏览 0提问于2020-06-13得票数 1

2回答

使用以KeyValuePair为键的字典的糟糕性能(C# .NET)

、、

在我正在编写的应用程序中，我需要两组可能很大的数据来相互映射。一个是从web服务返回的列表，另一个是DataTable。我需要为列表中的每个项目取ANSI (或ISO)号，并找到包含该ANSI号的DataTable行，然后对其进行处理。由于DataTable.Select非常慢，我必须对列表中的每一项都这样做，所以我尝试了更快的替代方案。请记住，DataTable对象没有数据库。所以我不能利用任何SQL功能或类似的东

浏览 4提问于2015-11-13得票数 6

回答已采纳

1回答

从regex匹配创建键值结构数组。

、

给定下面的项表和预定义模式(modern, rustic, contemporary, classic, vintage)列表，如何创建另一个表，其中包含按每个项的源组织的regex匹配(source_1, source_2等)，每个匹配的结构都是键值格式的，即<pattern STRING , source ARRAY<STRING>>，每一行将包含这些结构的数组，即ARRAY <<pattern['cottage bed',

浏览 7提问于2022-01-30得票数 1

回答已采纳

1回答

将dict键与文本文件匹配并返回测试通过/失败

、、、

我是Python的新手，目前正在做一个小的测试用例分配，在那里我将查找字典键并将其与一个小文本文件相匹配，并查看文本文件中是否存在这些键。关键是，我要找到和匹配，如果他们在场或缺席-一个匹配应该返回一个“测试通过”，没有匹配将返回一个跳过。字典中的键将被排序到一个列表中，然后迭代并与文本匹配。(字典<

浏览 3提问于2018-07-13得票数 0

5回答

使用将列表作为值的字典对列表进行分组的Pythonic方法

、、、

，然后进行查找.。创建这样一个字典的时间是O(n)。在这样创建的倒排字典中查找列表中的项。表示值Bar。使用信息'Bar': ['KeyB', 'KeyZ']创建一个新字典。结果字典将是{'KeyB': ['Bar'], 'KeyZ': ['Bar']}。对于下一项，我必须在现有字典</e

浏览 2提问于2017-12-27得票数 5

回答已采纳

3回答

在不知道其全名的情况下在字典中查找键

、

我有一个名为ev####的字典，其中####是一个我事先不知道的数字。在字典中只有一种类型的键，并且没有其他键以ev开头。在不知道####是什么的情况下访问密钥的最干净的方法是什么？

浏览 0提问于2011-11-01得票数 1

回答已采纳

3回答

将高级Python解码为更简单的代码

、、

我有一个代码，我想把它解码成简单的编程，比如简单的嵌套'for‘循环等等。我知道这对高级程序员来说可能是个愚蠢的问题，但我处于非常基本的编程水平。所以，如果有任何帮助，我们将不胜感激。有谁能帮我找出我怎么读这段代码，并把它解码成简单的嵌套循环吗？，谢谢，提前。

浏览 11提问于2015-04-02得票数 2

回答已采纳

1回答

如何使用python从txt文件中提取和组织数据？

、、

我是Python的初学者，用正则表达式和其他函数写出了它。emp_name = emp_name.group() emp_name = None 问题：，我在找约翰在约翰·史密斯之后，它不断地把所有的东西带到最后一行的电子邮件地址。我的最终目标是获得一个CSV文件，并将每个粗体项作为自己的列。更直接地说，专家将如何处理这种数据清理方法来简化过程？

浏览 5提问于2021-12-08得票数 1

回答已采纳

2回答

如何创建基于地名词典的命名实体识别(NER)系统？

、、

但我一直回避的是一个基于地名词典/字典的NER系统，在这个系统中，我的自由文本与预定义的实体名称列表进行匹配，并返回潜在的匹配。通过这种方式，我可以拥有不同的列表，比如个人、组织等等。我可以动态地更改列表，并获得不同的提取。这将极大地减少训练时间(因为它们中的大多数都是基于的，所以它们通常包括标记大型数据集，训练模型等)。我使用Lucene POS标记器构建了一个非常粗糙的基于地名词典的NER系统，我过去

浏览 6提问于2017-07-20得票数 3

3回答

python的process.extract()：它是如何工作的？

、、

我试图了解python模块fuzzywuzzy的函数process.extract()是如何工作的？我主要在这里读到了fuzzywuzzy软件包：，这是一个很好的帖子，它解释了在尝试进行模糊匹配时的不同场景。他们讨论了几种部分字符串相似的场景： 2)令牌排序然后，通过这篇文章：，我学会了如何使用fuzzywuzzy的process.extract()函数来选择顶部的k个匹配项下面是我在他们的GitHub页面()上找到的定义/

浏览 2提问于2016-12-15得票数 13

2回答

Python Numpy -矩阵内存错误和限制

、、

我有5036个文本文件和一个15985字的单词列表。对于文本文件中的单词列表中的每一个单词，我想在我的矩阵上放一个1。但我得到了错误: MemoryError。我还试着创建矩阵并打印(万一我的python代码中有bug )。我也有同样的错误。有什么建议吗？它应以这样的方式运作：从一个文件创建字典(文本文件上的每个单词都是名为"1_word1 2_word2“等，因此将文本文件的每一行

浏览 3提问于2015-11-09得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Python Regex:在稍微相似的文本上查找匹配项，并返回字典(或字典列表)

相关·内容

Python Regex:在稍微相似的文本上查找匹配项，并返回字典(或字典列表)

使用正则表达式的哈希表/字典/映射查找

在python中匹配regex并返回键

Python:从文本文件中提取哈希标签

将未知单词解析为已知单词的有效方法？

使用difflib查找单词字典

从Python中编译的regex中提取命名组正则表达式模式

用re替换文件中的单词

T-SQL确定字符串文本中的名词和动词

如何从我从Monkeylearn获得的API响应的python子列表中仅提取特定值

使用以KeyValuePair为键的字典的糟糕性能(C# .NET)

从regex匹配创建键值结构数组。

将dict键与文本文件匹配并返回测试通过/失败

使用将列表作为值的字典对列表进行分组的Pythonic方法

在不知道其全名的情况下在字典中查找键

将高级Python解码为更简单的代码

如何使用python从txt文件中提取和组织数据？

如何创建基于地名词典的命名实体识别(NER)系统？

python的process.extract()：它是如何工作的？

Python Numpy -矩阵内存错误和限制

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐