首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >删除版权的正则表达式

删除版权的正则表达式
EN

Stack Overflow用户
提问于 2012-01-18 08:32:45
回答 3查看 202关注 0票数 0

我需要从版权中删除年份。版权可以有以下几种形式:

代码语言:javascript
运行
复制
2011 Company --> 'Company'
Company 2011 --> 'Company'
2011 1 Company 2 --> '1 Company 2'
1 Company 2 1944 --> '1 Company 2'

如何删除4位数的版权并仅获取公司名称(请注意,公司名称中可能包含数字)。

到目前为止,我已经尝试了0-9{4},但在搜索中遇到了困难。

代码语言:javascript
运行
复制
>>> a=re.search('[0-9]{4}',a)
>>> a
<_sre.SRE_Match object at 0x10527b780>
>>> a.match(0)
>>> AttributeError: match
EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2012-01-18 08:43:36

尝尝这个

代码语言:javascript
运行
复制
>>> import re
>>> s = '2011 Company'
>>> removed = re.sub('(^\d{4})|(\d{4}$)','',s).strip()
>>> print removed
票数 1
EN

Stack Overflow用户

发布于 2012-01-18 08:46:20

代码语言:javascript
运行
复制
import re

def removeYear(inputStr):
    pattern1 = re.compile(r'^\d{4,4}\ (.*)')
    outputStr = re.sub(pattern1, r"\1", inputStr)

    pattern2 = re.compile(r'(.*)\ \d{4,4}$')
    fixedStr = re.sub(pattern2, r"\1", outputStr)
    print '-->'+ fixedStr

if __name__ == '__main__':
    removeYear('2011 Company')
    removeYear('Company 2011')
    removeYear('2011 1 Company 2')
    removeYear('1 Company 2 1944')
票数 1
EN

Stack Overflow用户

发布于 2012-01-18 08:43:59

代码语言:javascript
运行
复制
\d{4} 

意思是4位数字,或者你可以这样写来修剪空格:

代码语言:javascript
运行
复制
\s*\d{4}\s*

这是你想要的吗?

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8903669

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档