文章/答案/技术大牛

发布

社区首页 >问答首页 >python中特定字典中的文本处理和检测

问python中特定字典中的文本处理和检测
EN

Stack Overflow用户

提问于 2017-05-15 21:16:26

回答 1查看 133关注 0票数 0

我有一个英文文本，我想对其进行处理，以检测我在另一个Python词典中的特定条目(示例条目:质谱)。这些条目非常重要，因为它们需要为以后的注释进行匹配。为了做到这一点，我需要添加每个条目的多种形式(如复数、缩写等)。或者找到一种方法来进行智能处理。这种粗暴的方法不仅需要更多的时间(对我来说)，而且我可能无法解决所有的情况(我想要质谱，可能是光谱，但不是质谱)。我不是在寻找解决方案，我只需要如何处理问题和使用哪个工具包的指导方针。字典正在增长，智能方法将是首选。

我在Python中找到了NLTK，但我不确定如何在内置语料库的基础上使用我的字典。

例如:我有一句话:u‘’Liquid‘，u’‘biopsies’，u‘’based‘，u’‘on’，u‘Example’，u‘’cell free‘，u’‘DNA’，u'(cfDNA)'，u‘’analysis‘，u’‘are’，u‘’circulating‘，u’a‘，u’‘surrogate’，u‘’samples‘，u’‘for’，u‘分子’，u‘analysisis.’。我有一个关于{‘液体活组织检查’：‘血液分析’，‘cfDNA’：‘血液分析’的判决书。这些数组是故意使用的，因此它们都是相同的对象，因此试图在字典中创建别名。

如何将我的条目与文本匹配？

提前感谢！

python

dictionary

云点播特惠1元起

提供三端 SDK 、云 API、控制台等多种上传方式，弱网环境下文件上传成功率达到 99.5%

回答 1

Stack Overflow用户

发布于 2017-05-15 22:23:54

如果我没有误解您的话，您应该检查字典项和列表项。然后将结果打印到控制台。

dict_1={"Liquid Biopsy":"Blood for analysis","cfDNA":"Blood for analysis","Liquid Biopsies":"Blood for analysis"}
list_1=[u'Liquid', u'biopsies', u'based', u'on', u'circulating', u'cell-free', u'DNA', u'(cfDNA)', u'analysis', u'are', u'described', u'as', u'surrogate', u'samples', u'for', u'molecular', u'analysis.']
string_1=" ".join(list_1).lower()
for i in dict_1:
    if i.lower() in string_1:
        print("Key: {}\nValue: {}\n".format(i,dict_1[i]))

我使用了上面的代码，控制台打印出了以下结果。

Key: Liquid Biopsies
Value: Blood for analysis

Key: cfDNA
Value: Blood for analysis


Process finished with exit code 0

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/43988958

复制

正则表达式之匹配不存在特定字符的字符串

windows 编程算法正则表达式

作为一名不经常使用正则表达式的程序员，想用最简单的语言来描述否定匹配，不过发现确实不是那么好理解。还是按照自己知道的来描述吧。

李小白是一只喵

2020/04/24

5.7K0

js判断是否是字符串_js正则表达式匹配字符串

https 网络安全

全栈程序员站长

2022/11/08

5.8K0

go: 配置golangci-lint 与 precommit配合检查函数是否超过特定行数

git

最近代码规范很烦人。要求一个函数不能超过80行。只能在git pre-commit钩子上检查下了。这里使用golangci-lint，里面包含了funlen检查器 config.yaml

超级大猪

2021/06/29

1.9K0

js判断是否包含指定字符串_js正则表达式匹配字符串

编程算法 https 网络安全正则表达式 html

前言：有时候，我们在js中需要判断一个字符串中，是不是包含某个字符。可以采用以下方法进行判断。

全栈程序员站长

2022/11/08

2.9K0

正则表达式匹配_正则表达式匹配字符串长度

https java 网络安全编程算法

请实现一个函数用来匹配包括’.’和’*’的正则表达式。模式中的字符’.’表示任意一个字符，而’*’表示它前面的字符可以出现任意次（包含0次）。在本题中，匹配是指字符串的所有字符匹配整个模式。例如，字符串”aaa”与模式”a.a”和”ab*ac*a”匹配，但是与”aa.a”和”ab*a”均不匹配

全栈程序员站长

2022/09/19

2K0

Java检查枚举是否包含给定的字符串？

java

enum choices {a1, a2, b1, b2}; 方法一： public static boolean contains(String test) { for (Choice c : Choice.values()) { if (c.name().equals(test)) { return true; } } return false; } 方法二： EnumUtils.isValidEnum(MyEnum.cla

似水的流年

2019/12/06

4.4K0

使用MySQL的rlike判断字符串是否匹配

存储

表user_experience_wealth_log改名为user_experience_wealth_log_new，该表涉及若干存储过程。为了避免遗漏，需要确认所有相关过程都做了修改，验证方法为不存在包含user_experience_wealth_log的存储过程。

用户1148526

2020/04/30

1.7K0

字符串匹配（一） -- 朴素匹配与 KMP 算法

数据分析编程算法

软件算法中，最基础的算法要数排序和查找了，而字符串模式匹配算法可谓是基础中的基础，而最有名又最具代表性的字符串匹配算法要数 KMP 算法了，本文我们就来详细介绍一下 KMP 算法

用户3147702

2022/06/27

1.3K0

PHP正则表达式和字符串匹配

php

正则表达式是一种可以用来匹配字符串的模式。在PHP中，可以使用preg_match()函数来使用正则表达式进行匹配。preg_match()函数接受两个参数，第一个参数是正则表达式，第二个参数是要匹配的字符串。它返回匹配成功的次数，如果匹配失败则返回0。

堕落飞鸟

2023/04/27

1.3K0

JavaScript 技术篇-js正则表达式匹配字符串左右两边是否包含空格

javascript

同理 /(\s$)/ 是匹配右边的空格。只要包含空格是 /(\s)/。还可以通过 indexOf(" ") 来进行检测是否包含空格。

小蓝枣

2020/09/23

3K0

检查 Python 中给定字符串是否仅包含字母的方法

python 正则表达式 string 程序字符串

Python被世界各地的程序员用于不同的目的，如Web开发，数据科学，机器学习，并通过自动化执行各种不同的过程。在本文中，我们将了解检查python中给定字符串是否仅包含字符的不同方法。

很酷的站长

2023/08/11

2440

javascript 检查字符串是否是数字的几种方法

javascript

代码： //判断是否是正整数 function IsNum(s) { if(s!=null){ var r,re; re = /\d*/i; //\d表示数字,

零式的天空

2022/03/02

1.8K0

Java中判断某个String字符串是否包含特定字符串，并统计个数。

编程算法

原理很简单，用空格代替特定字符，然后计算与以前字符串的长度差,再除以特定字符的长度，即可得出A中所占b的个数。 **方法2：(利用indexOf与substring)**

Petterp

2022/02/09

3.4K0

perl 正则表达式匹配字符串或逻辑

perl java html https http

perl正则表示式的备忘 http://www.runoob.com/perl/perl-regular-expressions.html

全栈程序员站长

2022/08/30

6590

字符串的匹配算法_多字符串匹配

编程算法 https java 网络安全

不要被事物的表面现象所迷惑，这个算法全称：Brute Force，有个拉风的中文名：暴力匹配算法。

全栈程序员站长

2022/09/25

2.2K0

PHP正则表达式和字符串匹配示例

php

除了正则表达式之外，PHP还提供了一些字符串匹配函数。这些函数可以用于查找字符串中是否包含某个子串，或者从字符串中提取特定的子串。

堕落飞鸟

2023/04/27

1K0

Python判断字符串是否包含特定子串的7种方法

编程算法 python

在写代码的过程中，我们经常会遇到这样一个需求：判断字符串中是否包含某个关键词，也就是特定的子字符串。比如从一堆书籍名称中找出含有“python”的书名。

Crossin先生

2020/09/17

220.4K0

golang刷leetcode：检查是否有合法括号字符串路径

编程算法

一个括号字符串是一个非空且只包含 '(' 和 ')' 的字符串。如果下面任意条件为真，那么这个括号字符串就是合法的。

golangLeetcode

2022/08/02

9000

检查图片是否损坏、图片后缀是否与实际图片类型对应 - Python

linux gif png txt 脚本

日常工作中，时常会需要用到图片，有时候图片在下载、解压过程中会损坏，而如果一张一张点击来检查就太不Cool了，因此我想大家都需要一个检查脚本；

HoLoong

2020/09/21

3.3K0

点击加载更多

相似问题

检查字符串是否与特定模式匹配

检查字符串是否与特定格式匹配

检查项目是否与正则表达式字符串匹配

如何检查字符串是否与特定格式匹配？

132

如何检查字符串是否与特定格式匹配？

活动推荐

体验智能媒资降冷，云点播优惠不要错过！

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例