首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何正确地修复python3中的链接列表?

如何正确地修复python3中的链接列表?
EN

Stack Overflow用户
提问于 2017-04-15 15:54:32
回答 1查看 107关注 0票数 1

在使用了漂亮汤的soup.findAll('a', {'link': 'go to'})之后,我提取了一个链接列表,如:

代码语言:javascript
运行
复制
lis_links = ['https://foo.com/019774_s009_TEV 234.xml https://foo.com/019774_s009_TEV 23.xml https://foo.com/019774_s009_TEV24.xml https://foo.com/019774_s009_TEV 120.xml https://foo.com/WERW FOR INJ.xml']

如您所见,有些链接有"",如何用它的正确编码来修复空格(我猜它的是我试着使用replace(' ', '%20'),但是我无法控制在哪里使用它。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-04-15 16:26:20

使用负前瞻查找所有未后面跟着http:\s(?!http)的空格

RegEx演示

Python示例

代码语言:javascript
运行
复制
import re

def fixLinks(str):
   return re.sub(r"\s(?!http)", "%20", str)

links = ["https://foo.com/019774_s009_TEV 234.xml https://foo.com/019774_s009_TEV 23.xml https://foo.com/019774_s009_TEV24.xml https://foo.com/019774_s009_TEV 120.xml https://foo.com/WERW FOR INJ.xml"]

links[0] = fixLinks(links[0])

print links[0];

Python在线演示

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43428125

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档