首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >正则表达式匹配除数字和特殊字符之外的所有内容

正则表达式匹配除数字和特殊字符之外的所有内容
EN

Stack Overflow用户
提问于 2020-11-24 14:31:46
回答 2查看 97关注 0票数 0

对于这个列表,我如何提取除数字和特殊字符之外的所有内容。

代码语言:javascript
运行
复制
Jéssica Andrade 1
Joanna Jędrzejczyk
8 Maurício Rua
Jiří Procházka
(6) Anthony Smith
Volkan Oezdemir
Nikita Krylov
Johnny Walker 9

所需输出/匹配:

代码语言:javascript
运行
复制
Jéssica Andrade
Joanna Jędrzejczyk
Maurício Rua
Jiří Procházka
Anthony Smith
Volkan Oezdemir
Nikita Krylov
Johnny Walker

[a-z A-Z]+仅匹配英文字符。[^\x00-\x7F]+[^\u0000-\u007F]+仅匹配非英语字符。

不知道从这里该做什么。

EN

回答 2

Stack Overflow用户

发布于 2020-11-24 14:39:38

尝试执行以下正则表达式(带有i标志),

代码语言:javascript
运行
复制
([a-z\u00C0-\u024F] ?)+

Regex Demo

解释

匹配的i enabled)

  • [\u00C0-\u024F]

  • ? -匹配空格0次或1次
票数 1
EN

Stack Overflow用户

发布于 2020-11-24 14:50:33

您可以在re.sub中使用此正则表达式

代码语言:javascript
运行
复制
\s*(?:\d|[^\w\s])+\s*

RegEx Demo

RegEx详细信息:

  • \s*:匹配0个或更多个whitespaces
  • (?:\d|[^\w\s]):匹配不是单词字符且不是空格的数字或字符。匹配1个或多个此非捕获group.
  • \s*:匹配0个或多个空格

代码:

代码语言:javascript
运行
复制
import re

regex = r"[ \t]*(?:\d|[^\w\s])+[ \t]*"

test_str = ("Jéssica Andrade 1\n"
    "Joanna Jędrzejczyk\n"
    "8 Maurício Rua\n"
    "Jiří Procházka\n"
    "(6) Anthony Smith\n"
    "Volkan Oezdemir\n"
    "Nikita Krylov\n"
    "Johnny Walker 9\n")

result = re.sub(regex, "", test_str, 0, re.UNICODE)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64981312

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档