首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >在Python中使用RegEx查找以h开头的单词,但不包括html标记

在Python中使用RegEx查找以h开头的单词,但不包括html标记
EN

Stack Overflow用户
提问于 2016-12-09 17:57:14
回答 1查看 139关注 0票数 0

我正在尝试查找所有以h开头的单词,但我需要排除html标记,就像在这个搜索中一样。我有查找所有以h开头的单词的代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
\h\w+

我只是不知道如何在我的搜索中排除东西,特别是一个html标签。

EN

回答 1

Stack Overflow用户

发布于 2016-12-09 18:21:39

使用de exclude character [^]

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[^<]h\w+ 

但我认为这种方式可能更适合您的需要,因为它会为每个以h开头的不是a的单词生成一个匹配

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 (?!<)h\w+

更好的方法是,执行以下匹配:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 ((?!<)h\w+)

(请密切关注,第一个(前面有一个空格)

如果文本为:

html teste agharro hzete h

它将与“homem”和“hzete”进行完全匹配,这是第一个匹配您想要的单词。"homem","hzete“。

我向你推荐一个图形化的正则表达式验证工具,这样你就可以实时看到你正在编写的表达式。一个很好的例子是https://regex101.com/

希望这能有所帮助。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41066251

复制
相关文章
HTML中的标记
文章目录 前言 块级元素 行内元素 行内块级元素 ---- 前言 HTML中的标记 块级元素 h1-h6>>1-6级标题 p>>段落 div>>定义文档中的节 ul>>定义无序列表 ol>>定义有序列表 li>>定义无序列表与有序列表中的项 hr>>水平线 address>>定义文档作者或拥有者的联系信息 blockquote>>定义长的引用 pre>>定义预格式文本 form>>定义表单 fieldset>>定义围绕表单中元素的边框 legend>>定义 fieldset 元素的
MIKE笔记
2023/03/23
5.6K0
正则表达式用法简介与速查
匹配以“sales”开头,后跟任意一个字符,再后以“.xls”结尾的10字符组合。
全栈程序员站长
2021/07/08
3.7K0
mongodb 字符串查找匹配中$regex的用法
官网地址:https://docs.mongodb.com/manual/reference/operator/query/regex/#regex-case-insensitive
庞小明
2018/12/10
6.2K0
H5中的标记方法
要使用H5标记,必须先进行如下的doctype声明,不区分大小写。Web浏览器通过判断文件开头有没有这个声明,来判断解析器和渲染类型是否切换到对应的H5模式。
week
2018/08/24
9690
Python 在 Wiki 标记中添加无
Python编程快速上手实践项目题目,欢迎指证与优化! 代码: #! python3 # bulletPointAdder.py - Adds Wikipedia bullet points to the start # of each line of text on the clipboard. import pyperclip text = pyperclip.paste() # 从剪贴板粘贴文本 lines = text.split('\n') # 使用 split()方法得到一个字符串的列表,以回
py3study
2020/01/09
3K0
一文弄懂正则表达式
如果说什么是我学习编程来最好用,最常用的知识点,那应该就是正则表达式了。严谨的说,正则表达式并不是一门编程语言,也不是为了一种编程语言而服务的知识。但他确实足够好用,应用也足够广泛。
罗罗攀
2021/01/20
6660
挑战30天学完Python:Day18 正则表达式
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。要在python中使用RegEx,首先我们应该导入名为 re 的模块。
MegaQi
2023/10/21
3230
挑战30天学完Python:Day18 正则表达式
简单的正则表达式
特殊字符 ^ $ * ? + {2} {2,} {2,5} | [] [^] [a-z] . \s \S \w \W [\u4E00-\u9FA5] () \d 常用的6个re中的函数
听城
2018/04/27
1.5K0
正则表达式(二)
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。例如,在Perl中就内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的。正则表达式通常缩写成“regex”,单数有regexp、regex,复数有regexps、regexes、regexen。
胡齐
2020/02/14
7060
MSVC下使用gnu regex(正则表达式C语言接口regex.h)
最近我的一个跨平台项目遇到了一个问题:需要在MSVC下调用linux下才有正则表达式C接口(regex.h)。
10km
2021/11/10
9630
在Python中实现线性查找
线性查找算法是最简单的查找算法之一。线性查找算法的输入是一个数组或列表和项,该算法查找数组中是否存在该项。如果找到该项,则返回其索引;否则,可以返回null或你认为在数组中不存在的任何其他值。
fanjy
2022/11/16
3.2K0
在Python中实现线性查找
Python 正则表达式一文通
正则表达式可用于搜索、编辑和操作文本。Python RegEx 被几乎所有的公司广泛使用,并且对他们的应用程序具有良好的行业吸引力,从而使得正则表达式越来越受重视
周萝卜
2022/09/28
1.8K0
Python判断字符串是否以字母开头
直接上代码吧 import re rule = re.compile('^[a-zA-z]{1}.*$') str='123' if rule.match(str) is None: print(str+'不以字母开头') else: print(str+'以字母开头') str2='a12' if rule.match(str2) is None: print(str2+'不以字母开头') else: print(str2+'以字母开头')
week
2020/03/12
3K0
Linux通配符和正则表达式通配符 区别_linux正则表达式语法
通配符是shell在做PathnameExpansion时用到的。说白了一般只用于文件名匹配,它是由shell解析的,比如find,ls,cp,mv等。
全栈程序员站长
2022/10/02
5.1K0
Linux通配符和正则表达式通配符 区别_linux正则表达式语法
python入门(八)单词堆中查找特定单词(正则表达式)
#用正则表达式找到文本中所有的s开头,e结尾的单词 import re text = "site sea sue sweet see case sse ssee loses" m = re.findall(r"\bs\S*e\b", text) if m: print(m) else: print('not match') 以上程序中所用到的知识点如下: re.findall(r"正则表达式", text) #re是python里的正则表达式模块 findall() #用来按照
星辉
2019/01/15
3.7K0
正则表达式介绍与使用
正则表达式(Regular Expression)描述字符串结构模式的形式化表达方法,正则(Regex)表达式处理的对象的字符串或者抽象地说是一个对象序列(计算机体系的本质数据结构) 正则表达式是一种文本模式包括普通字符(例如a 到 z 之间的字母)和特殊字符(称为”元字符”),用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”;
全栈工程师修炼指南
2022/09/28
1.7K0
正则表达式介绍与使用
正则表达式介绍与使用
正则表达式(Regular Expression)描述字符串结构模式的形式化表达方法,正则(Regex)表达式处理的对象的字符串或者抽象地说是一个对象序列(计算机体系的本质数据结构) 正则表达式是一种文本模式包括普通字符(例如a 到 z 之间的字母)和特殊字符(称为”元字符”),用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”;
全栈工程师修炼指南
2020/10/23
1.2K0
正则表达式介绍与使用
掌握 Python RegEx:深入探讨模式匹配
正则表达式通常缩写为 regex,是处理文本的有效工具。本质上,它们由一系列建立搜索模式的字符组成。该模式可用于广泛的字符串操作,包括匹配模式、替换文本和分割字符串。
数据科学工厂
2023/08/10
2370
掌握 Python RegEx:深入探讨模式匹配
JavaScript自定义对话框(包括但不限于 HTML,CSS,JavaScript)
JavaScript 自定义对话框,html5自适应对话框,不采用任何外部框架,纯 JavaScript
xlj
2021/07/14
8390
点击加载更多

相似问题

在regex中以@符号开头的单词之间插入html标记。

210

在regex中查找以特定单词开头的单词

12

使用Python regex查找以特定字母开头和结尾的单词

20

Regex,查找大写代码,但不包括以美元符号开头的数字

42

Regex以查找以特定字符开头的单词

536
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文