首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >python .replace()正则表达式

python .replace()正则表达式
EN

Stack Overflow用户
提问于 2012-07-14 02:03:50
回答 3查看 607.6K关注 0票数 366

我试图抓取'</html>'标记后的所有内容并将其删除,但我的代码似乎什么也没做。.replace()不支持正则表达式吗?

代码语言:javascript
复制
z.write(article.replace('</html>.+', '</html>'))
EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2012-07-14 02:05:05

不是的。Python中的正则表达式由re模块处理。

代码语言:javascript
复制
article = re.sub(r'(?is)</html>.+', '</html>', article)

一般而言:

代码语言:javascript
复制
text_after = re.sub(regex_search_term, regex_replacement, text_before)
票数 592
EN

Stack Overflow用户

发布于 2012-07-14 03:01:51

您可以将re模块用于正则表达式,但是正则表达式可能无法满足您的需要。我可能会尝试这样的东西

代码语言:javascript
复制
z.write(article[:article.index("</html>") + 7]

这要干净得多,而且应该比基于正则表达式的解决方案快得多。

票数 9
EN

Stack Overflow用户

发布于 2017-06-25 04:08:10

对于这种特殊情况,如果使用re模块有点过分,那么使用split (或rsplit)方法如何?

代码语言:javascript
复制
se='</html>'
z.write(article.split(se)[0]+se)

例如,

代码语言:javascript
复制
#!/usr/bin/python

article='''<html>Larala
Ponta Monta 
</html>Kurimon
Waff Moff
'''
z=open('out.txt','w')

se='</html>'
z.write(article.split(se)[0]+se)

输出out.txt

代码语言:javascript
复制
<html>Larala
Ponta Monta 
</html>
票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11475885

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档