文章/答案/技术大牛

发布

社区首页 >问答首页 >在某个字符python前后截断文本

问在某个字符python前后截断文本
EN

Stack Overflow用户

提问于 2018-04-15 14:33:33

回答 1查看 123关注 0票数 1

我在巨蟒上读到了大量的文字，

案文的格式如下：

blablabla
***** END HEADER ******

valid content


***** start footer *****
blablalba

我需要删除所有文本中的页眉和页脚，方法是删除所有字符串，直到*结束页眉*，以及在*开始页脚*之后的所有内容。

如能提供任何帮助，将不胜感激。

到目前为止我试过了：

import re

chop = re.compile('(/.+)*** END HEADER *****', re.DOTALL)

data_chopped = chop.sub('', text_file)

但我不断地发现错误：

sre_constants.error: multiple repeat at position

python

regex

text

truncate

Stack Overflow用户

回答已采纳

发布于 2018-04-15 14:42:46

可能还有其他有效的方法，其中一种方法可能是尝试使用多个拆分：

txt = """blablabla
***** END HEADER ******

valid content


***** start footer *****
blablalba
"""

# split the header and take the second section of split
tmp = ''.join(txt.split('***** END HEADER ******')[1])
# split by footer and take the first section of split
tmp2 = ''.join(tmp.split('***** start footer *****')[0])
result = tmp2.strip()
print(result)

结果：

'valid content'

票数 0

查看全部 1 条回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/49843095

复制

相似问题

问在某个字符python前后截断文本
EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在某个字符python前后截断文本EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在某个字符python前后截断文本
EN