首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在某个字符python前后截断文本

在某个字符python前后截断文本
EN

Stack Overflow用户
提问于 2018-04-15 14:33:33
回答 1查看 123关注 0票数 1

我在巨蟒上读到了大量的文字,

案文的格式如下:

代码语言:javascript
运行
复制
blablabla
***** END HEADER ******

valid content


***** start footer *****
blablalba

我需要删除所有文本中的页眉和页脚,方法是删除所有字符串,直到*结束页眉*,以及在*开始页脚*之后的所有内容。

如能提供任何帮助,将不胜感激。

到目前为止我试过了:

代码语言:javascript
运行
复制
import re

chop = re.compile('(/.+)*** END HEADER *****', re.DOTALL)

data_chopped = chop.sub('', text_file)

但我不断地发现错误:

代码语言:javascript
运行
复制
sre_constants.error: multiple repeat at position
EN

Stack Overflow用户

回答已采纳

发布于 2018-04-15 14:42:46

可能还有其他有效的方法,其中一种方法可能是尝试使用多个拆分:

代码语言:javascript
运行
复制
txt = """blablabla
***** END HEADER ******

valid content


***** start footer *****
blablalba
"""

# split the header and take the second section of split
tmp = ''.join(txt.split('***** END HEADER ******')[1])
# split by footer and take the first section of split
tmp2 = ''.join(tmp.split('***** start footer *****')[0])
result = tmp2.strip()
print(result)

结果:

代码语言:javascript
运行
复制
'valid content'
票数 0
EN
查看全部 1 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/49843095

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档