问Python split()，不删除分隔符
EN

Stack Overflow用户

提问于 2011-10-23 20:28:51

回答 4查看 118.6K关注 0票数 112

这段代码几乎做了我需要它做的事情。

for line in all_lines:
    s = line.split('>')

除非它删除了所有的'>‘分隔符。

所以,

<html><head>

变成了

['<html','<head']

有没有办法使用split()方法，但保留分隔符，而不是删除它？

有了这些结果..

['<html>','<head>']

python

split

delimiter

回答 4

Stack Overflow用户

回答已采纳

发布于 2011-10-23 20:38:25

d = ">"
for line in all_lines:
    s =  [e+d for e in line.split(d) if e]

票数 68

Stack Overflow用户

发布于 2011-10-23 22:54:33

如果您正在使用拆分来解析HTML，那么您很可能做错了，除非您正在编写针对固定且安全的内容文件的一次性脚本。如果它可以处理任何超文本标记语言的输入，你将如何处理像<a title='growth > 8%' href='#something'>这样的东西

无论如何，下面的方法对我来说是有效的：

>>> import re
>>> re.split('(<[^>]*>)', '<body><table><tr><td>')[1::2]
['<body>', '<table>', '<tr>', '<td>']

票数 36

Stack Overflow用户

发布于 2011-10-23 20:45:35

这样如何：

import re
s = '<html><head>'
re.findall('[^>]+>', s)

票数 21

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/7866128

复制

相似问题

问Python split()，不删除分隔符
EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python split()，不删除分隔符EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python split()，不删除分隔符
EN