首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何在Python中移除字符串中的任何URL

如何在Python中移除字符串中的任何URL
EN

Stack Overflow用户
提问于 2012-07-04 23:30:57
回答 10查看 140K关注 0票数 60

我想删除字符串中的所有URL(用“”替换它们),我到处搜索,但没有真正找到我想要的。

示例:

代码语言:javascript
复制
text1
text2
http://url.com/bla1/blah1/
text3
text4
http://url.com/bla2/blah2/
text5
text6
http://url.com/bla3/blah3/

我希望结果是:

代码语言:javascript
复制
text1
text2
text3
text4
text5
text6
EN

回答 10

Stack Overflow用户

发布于 2016-11-27 05:01:05

最短的路

代码语言:javascript
复制
re.sub(r'http\S+', '', stringliteral)
票数 86
EN

Stack Overflow用户

发布于 2012-07-05 00:12:44

这对我很有效:

代码语言:javascript
复制
import re
thestring = "text1\ntext2\nhttp://url.com/bla1/blah1/\ntext3\ntext4\nhttp://url.com/bla2/blah2/\ntext5\ntext6"

URLless_string = re.sub(r'\w+:\/{2}[\d\w-]+(\.[\d\w-]+)*(?:(?:\/[^\s/]*))*', '', thestring)
print URLless_string

结果:

代码语言:javascript
复制
text1
text2

text3
text4

text5
text6
票数 25
EN

Stack Overflow用户

发布于 2018-04-26 14:48:18

删除混在任何文本中的HTTP链接/URL:

代码语言:javascript
复制
import re
re.sub(r'''(?i)\b((?:https?://|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}/)(?:[^\s()<>]+|\(([^\s()<>]+|(\([^\s()<>]+\)))*\))+(?:\(([^\s()<>]+|(\([^\s()<>]+\)))*\)|[^\s`!()\[\]{};:'".,<>?«»“”‘’]))''', " ", text)
票数 17
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11331982

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档