在Python中删除字符串中的非字母数字unicode字符

文章/答案/技术大牛

发布

13回答

在Python字符串中删除重音(规范化)的最佳方法是什么？

python、python-3.x、unicode、python-2.x、diacritics

我在Python中有一个Unicode字符串，我想删除所有的重音(diacritics)。我在web上发现了一种很好的方法(在Java中)：删除Unicode类型为"dia

浏览 32提问于2009-02-05得票数 718

回答已采纳

1回答

摘除非字母数字字符

python

我使用以下正则表达式从string中删除非字母数字字符(不移除空格)。pattern = re.compile('([^\s\w]|_)+', re.UNICODE)√ß√†我有一个用户查询

浏览 0提问于2017-12-29得票数 1

回答已采纳

2回答

Python正则表达式:删除非ASCII字符和以数字结尾的单词

python、regex

我试图用字符串中的“”替换所有非ASCII字符(重音、符号)，然后替换以数字结尾的所有单词。我认为r‘w\b^a*a\b’会这样做，因为我认为它是“删除非ASCII字符，或删除以0或更多的非字母开头并以非字母结尾的整个单词”。所谓非字母，我指的是所有与a-z不匹配的<

浏览 0提问于2017-08-02得票数 1

回答已采纳

3回答

从C# "Unicode“字符串中移除字母和数字以外的所有字符

c#、string、unicode、non-alphanumeric

从字符串中删除非字母数字字符是一项简单的工作。A' && c <= 'Z') || (c >= '0' && c <= '9'))}该方法适用于ASCII字符是否有删除"UNICODE“文本中所有<

浏览 9提问于2022-08-18得票数 2

1回答

Python :使用re.ASCII的模式仍然可以匹配unicode字符吗？

python、regex、unicode、ascii

我是Python regex的新手，并试图在Python中匹配非空白的ASCII字符。以下是我的代码： p.search我已经在re.compile中指定了ASCII模式，但是p.search(

浏览 2提问于2020-04-14得票数 1

回答已采纳

1回答

Python正则表达式:除异常外不允许字符

python、regex

在我的实际项目中，我想从用户那里获得一些输入。它不能在开头、结尾或连续两次或更多处包含空格，也不能包含任何不是字母或数字的内容。我想允许点，但\W不允许。我不能用[^a-zA-Z0-9\s\s.]代替它，因为它不允许我想要允许的‘sü’这样的字符。除了单个空白空间和点之外，我如何更改代码以不允许模式中的</em

浏览 2提问于2020-11-16得票数 1

回答已采纳

1回答

只保留字符串中的字母字符(多语种)

python、string、multilingual

在堆栈溢出中，有很多关于如何只保留字符串中的字母字符的答案，最常见的是著名的regex '[^a-zA-Z]'。但是这个答案是完全错误的，因为它假设每个人都只写英语.我想我可以否决所有这些答案，但我最终认为再次问这个问题会更有建设性，因为我找不到答案。有没有容易的(或不.)在python中，只保留所有语言中<

浏览 2提问于2017-06-27得票数 12

回答已采纳

2回答

Python Regex -匹配字符串中的混合Unicode和ASCII字符

python、regex、string、python-2.7、unicode

我尝试了几种不同的方法，但都不起作用。s = '[မန္း],[aa]'.decode('utf-8')pattern = re.compile(r'\[(\w+)\]', re.UNICODE)pattern.findall(s, re.UNICODE) 结果基本上就是[]，而不

浏览 0提问于2017-08-11得票数 0

2回答

在保存字母数字的同时将非字母数字符号转换为unicode

我需要将字符串中的非字母数字符号转换为它们的unicode值，同时保留字母数字字符。在C#中有这样做的方法吗？"hello world!"

浏览 0提问于2019-03-10得票数 3

回答已采纳

7回答

从字符串的开头和结尾修剪非字母

c#、.net、regex

从字符串的开头和结尾裁剪所有非字母数字字符的最佳方法是什么？我尝试手动添加我不需要的字符，但它不能很好地工作，并使用。我只需要修剪任何不是字母数字的东西。aaaannnndóú(*&^1#*32%#**)7(#9&^"; string somethingNew = Regex.Replace(something, @"[^\p{L}-\s]

浏览 0提问于2014-06-22得票数 2

2回答

OCaml:如何从字符串中删除所有非字母字符？

regex、unicode、ocaml

如何从字符串中删除所有非字母字符？"Wë_1ird?!" -> "Wëird"re.sub(ur'[\W\d_]+', u'', u"Wë_1ird?!"

浏览 2提问于2014-11-07得票数 2

回答已采纳

1回答

python、utf-8、ascii

如何转换此字符串：此字符串？：即如何删除非字母数字unicode字符？我尝试过将字符串编码为ascii的解决方案，但它不适用于日语符号。

浏览 26提问于2019-07-18得票数 0

2回答

行首的可选匹配

python、regex、hashtag

我试图在Python中创建一个与#hashtag匹配的正则表达式。我对hashtag的定义是： #This string cont#ains #four, and #only four #hashtags.这里的哈希是This，four，only和hasht

浏览 1提问于2012-09-26得票数 0

回答已采纳

1回答

VBA regex unicode字符组支持的替代方案

regex、excel、vba、unicode

VBA正则表达式字符组不支持unicode字符组(例如{p(L})。此外，\w仅匹配拉丁字母数字。所以我的问题是如何在不在pattern字段中键入整个字符列表的情况下替换unicode字符串中的非字母数字字符。例如，如果尝试将"abc (for αβψ̌) and de (for δε)"<

浏览 11提问于2018-01-22得票数 1

2回答

如何在保留unicode编码字符和撇号( \‘)的同时删除非字母数字字符？

python、regex、unicode、encoding

我有一个文本，我想删除所有非字母数字字符，但是保留unicode编码字符和撇号，因为它是单词的一部分，比如不是，不能，法语缩写等等。我知道我可以做re.sub(ur'\W', '', text, flags = re.UNICODE)来删除所有非字母数字字符，但是我不知道如何做同样的事情来

浏览 2提问于2016-12-12得票数 1

回答已采纳

6回答

默认情况下应该使用Unicode字符串吗？

python、unicode

在Python中编码时，选择Unicode字符串而不是常规字符串是一种好的做法吗？我主要在Windows平台上工作，现在大多数字符串类型都是Unicode (即.NET字符串，在新的c++项目中默认打开'_UNICODE‘，等等)。因此，我倾向于认为使用非Unicode字符串对象的情

浏览 1提问于2009-07-12得票数 20

回答已采纳

2回答

从lua字符串中删除所有非字母数字字符

lua、alphanumeric、non-alphanumeric

I检查字符串中的非字母数字字符。 --make str alpha-numeric如何使用lua从字符串中删除所有非字母数字字符？

浏览 13提问于2013-05-07得票数 6

1回答

在vscode中使用表情符号进行编码

javascript、visual-studio-code、intellisense、emoji、jshint

下面是按字母顺序的变量。我试着用表情符号编码，并从表情符号中获取智慧。支持了吗？

浏览 1提问于2019-03-11得票数 1

回答已采纳

1回答

在非字母数字字符和字母数字字符之间插入空格，但特定字符除外(Python)

python、regex、tokenize、arabic、diacritics

是否有可能将某些unicode (非字母数字)排除在考虑范围之外？我对包含变音符号的阿拉伯语单词进行标记化，这被认为是非字母数字字符，但我不想删除它们，我需要在非字母数字字符(变音符号除外)和字母数字字符之间留一个空格。这是通过使用regex实现的吗？我要排除表示变音符号<e

浏览 0提问于2013-06-29得票数 2

回答已采纳

1回答

搜索正则表达式，以匹配一次不适合多个属性的Unicode字符

regex、unicode

搜索一个正则表达式，以匹配一次不适合多个属性的Unicode字符。例如，假设我希望搜索字符串中的所有字符同时存在：这显然不起作用：/[\P{Lu}\P{Ll}\P{Nd}]/u 看来我需要一个合乎逻辑的内线

浏览 5提问于2016-05-05得票数 0

回答已采纳

点击加载更多

在Python字符串中删除重音(规范化)的最佳方法是什么？

摘除非字母数字字符

Python正则表达式:删除非ASCII字符和以数字结尾的单词

从C# "Unicode“字符串中移除字母和数字以外的所有字符

Python :使用re.ASCII的模式仍然可以匹配unicode字符吗？

Python正则表达式:除异常外不允许字符

只保留字符串中的字母字符(多语种)

Python Regex -匹配字符串中的混合Unicode和ASCII字符

在保存字母数字的同时将非字母数字符号转换为unicode

从字符串的开头和结尾修剪非字母

OCaml:如何从字符串中删除所有非字母字符？