腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
13
回答
在
Python
字符串
中
删除
重音(规范化)
的
最佳方法是什么?
python
、
python-3.x
、
unicode
、
python-2.x
、
diacritics
我
在
Python
中有一个
Unicode
字符串
,我想
删除
所有的重音(diacritics)。我
在
web上发现了一种很好
的
方法(
在
Java
中
):
删除
Unicode
类型为"dia
浏览 32
提问于2009-02-05
得票数 718
回答已采纳
1
回答
摘除非
字母
数字
字符
python
我使用以下正则表达式从string
中
删除
非
字母
数字
字符
(不移除空格)。pattern = re.compile('([^\s\w]|_)+', re.
UNICODE
)√ß√†我有一个用户查询
浏览 0
提问于2017-12-29
得票数 1
回答已采纳
2
回答
Python
正则表达式:
删除
非ASCII
字符
和以
数字
结尾
的
单词
python
、
regex
我试图用
字符串
中
的
“”替换所有
非
ASCII
字符
(重音、符号),然后替换以
数字
结尾
的
所有单词。我认为r‘w\b^a*a\b’会这样做,因为我认为它是“
删除
非ASCII
字符
,或
删除
以0或更多
的
非
字母
开头并以
非
字母
结尾
的
整个单词”。所谓
非
字母
,我指的是所有与a-z不匹配
的<
浏览 0
提问于2017-08-02
得票数 1
回答已采纳
3
回答
从C# "
Unicode
“
字符串
中
移除
字母
和
数字
以外
的
所有
字符
c#
、
string
、
unicode
、
non-alphanumeric
从
字符串
中
删除
非
字母
数字
字符
是一项简单
的
工作。A' && c <= 'Z') || (c >= '0' && c <= '9'))}该方法适用于ASCII
字符
是否有
删除
"
UNICODE
“文本中所有<
浏览 9
提问于2022-08-18
得票数 2
1
回答
Python
:使用re.ASCII
的
模式仍然可以匹配
unicode
字符
吗?
python
、
regex
、
unicode
、
ascii
我是
Python
regex
的
新手,并试图
在
Python
中
匹配
非
空白
的
ASCII
字符
。以下是我
的
代码: p.search我已经
在
re.compile中指定了ASCII模式,但是p.search(
浏览 2
提问于2020-04-14
得票数 1
回答已采纳
1
回答
Python
正则表达式:除异常外不允许
字符
python
、
regex
在
我
的
实际项目中,我想从用户那里获得一些输入。它不能在开头、结尾或连续两次或更多处包含空格,也不能包含任何不是
字母
或
数字
的
内容。 我想允许点,但\W不允许。我不能用[^a-zA-Z0-9\s\s.]代替它,因为它不允许我想要允许
的
‘sü’这样
的
字符
。除了单个空白空间和点之外,我如何更改代码以不允许模式
中
的</em
浏览 2
提问于2020-11-16
得票数 1
回答已采纳
1
回答
只保留
字符串
中
的
字母
字符
(多语种)
python
、
string
、
multilingual
在
堆栈溢出
中
,有很多关于如何只保留
字符串
中
的
字母
字符
的
答案,最常见
的
是著名
的
regex '[^a-zA-Z]'。但是这个答案是完全错误
的
,因为它假设每个人都只写英语.我想我可以否决所有这些答案,但我最终认为再次问这个问题会更有建设性,因为我找不到答案。有没有容易
的
(或不.)
在
python
中
,只保留所有语言中<
浏览 2
提问于2017-06-27
得票数 12
回答已采纳
2
回答
Python
Regex -匹配
字符串
中
的
混合
Unicode
和ASCII
字符
python
、
regex
、
string
、
python-2.7
、
unicode
我尝试了几种不同
的
方法,但都不起作用。s = '[မန္း],[aa]'.decode('utf-8')pattern = re.compile(r'\[(\w+)\]', re.
UNICODE
)pattern.findall(s, re.
UNICODE
) 结果基本上就是[],而不
浏览 0
提问于2017-08-11
得票数 0
2
回答
在
保存
字母
数字
的
同时将
非
字母
数字符
号转换为
unicode
c#
我需要将
字符串
中
的
非
字母
数字符
号转换为它们
的
unicode
值,同时保留
字母
数字
字符
。
在
C#中有这样做
的
方法吗?"hello world!"
浏览 0
提问于2019-03-10
得票数 3
回答已采纳
7
回答
从
字符串
的
开头和结尾修剪
非
字母
c#
、
.net
、
regex
从
字符串
的
开头和结尾裁剪所有
非
字母
数字
字符
的
最佳方法是什么?我尝试手动添加我不需要
的
字符
,但它不能很好地工作,并使用。我只需要修剪任何不是
字母
数字
的
东西。aaaannnndóú(*&^1#*32%#**)7(#9&^"; string somethingNew = Regex.Replace(something, @"[^\p{L}-\s]
浏览 0
提问于2014-06-22
得票数 2
2
回答
OCaml:如何从
字符串
中
删除
所有
非
字母
字符
?
regex
、
unicode
、
ocaml
如何从
字符串
中
删除
所有
非
字母
字符
?"Wë_1ird?!" -> "Wëird"re.sub(ur'[\W\d_]+', u'', u"Wë_1ird?!"
浏览 2
提问于2014-11-07
得票数 2
回答已采纳
1
回答
在
Python
中
删除
字符串
中
的
非
字母
数字
unicode
字符
python
、
utf-8
、
ascii
如何转换此
字符串
:此
字符串
?:即如何
删除
非
字母
数字
unicode
字符
?我尝试过将
字符串
编码为ascii
的
解决方案,但它不适用于日语符号。
浏览 26
提问于2019-07-18
得票数 0
2
回答
行首
的
可选匹配
python
、
regex
、
hashtag
我试图
在
Python
中
创建一个与#hashtag匹配
的
正则表达式。我对hashtag
的
定义是: #This string cont#ains #four, and #only four #hashtags.这里
的
哈希是This,four,only和hasht
浏览 1
提问于2012-09-26
得票数 0
回答已采纳
1
回答
VBA regex
unicode
字符
组支持
的
替代方案
regex
、
excel
、
vba
、
unicode
VBA正则表达式
字符
组不支持
unicode
字符
组(例如{p(L})。此外,\w仅匹配拉丁
字母
数字
。所以我
的
问题是如何在不在pattern字段中键入整个
字符
列表
的
情况下替换
unicode
字符串
中
的
非
字母
数字
字符
。例如,如果尝试将"abc (for αβψ̌) and de (for δε)"<
浏览 11
提问于2018-01-22
得票数 1
2
回答
如何在保留
unicode
编码
字符
和撇号( \‘)
的
同时
删除
非
字母
数字
字符
?
python
、
regex
、
unicode
、
encoding
我有一个文本,我想
删除
所有
非
字母
数字
字符
,但是保留
unicode
编码
字符
和撇号,因为它是单词
的
一部分,比如不是,不能,法语缩写等等。我知道我可以做re.sub(ur'\W', '', text, flags = re.
UNICODE
)来
删除
所有
非
字母
数字
字符
,但是我不知道如何做同样
的
事情来
浏览 2
提问于2016-12-12
得票数 1
回答已采纳
6
回答
默认情况下应该使用
Unicode
字符串
吗?
python
、
unicode
在
Python
中
编码时,选择
Unicode
字符串
而不是常规
字符串
是一种好
的
做法吗?我主要在Windows平台上工作,现在大多
数字符串
类型都是
Unicode
(即.NET
字符串
,
在
新
的
c++项目中默认打开'_
UNICODE
‘,等等)。因此,我倾向于认为使用
非
Unicode
字符串
对象
的
情
浏览 1
提问于2009-07-12
得票数 20
回答已采纳
2
回答
从lua
字符串
中
删除
所有
非
字母
数字
字符
lua
、
alphanumeric
、
non-alphanumeric
I检查
字符串
中
的
非
字母
数字
字符
。 --make str alpha-numeric如何使用lua从
字符串
中
删除
所有
非
字母
数字
字符
?
浏览 13
提问于2013-05-07
得票数 6
1
回答
在
vscode中使用表情符号进行编码
javascript
、
visual-studio-code
、
intellisense
、
emoji
、
jshint
下面是按
字母
顺序
的
变量。我试着用表情符号编码,并从表情符号
中
获取智慧。支持了吗?
浏览 1
提问于2019-03-11
得票数 1
回答已采纳
1
回答
在
非
字母
数字
字符
和
字母
数字
字符
之间插入空格,但特定
字符
除外(
Python
)
python
、
regex
、
tokenize
、
arabic
、
diacritics
是否有可能将某些
unicode
(
非
字母
数字
)排除
在
考虑范围之外?我对包含变音符号
的
阿拉伯语单词进行标记化,这被认为是非
字母
数字
字符
,但我不想
删除
它们,我需要在
非
字母
数字
字符
(变音符号除外)和
字母
数字
字符
之间留一个空格。这是通过使用regex实现
的
吗?我要排除表示变音符号<e
浏览 0
提问于2013-06-29
得票数 2
回答已采纳
1
回答
搜索正则表达式,以匹配一次不适合多个属性
的
Unicode
字符
regex
、
unicode
搜索一个正则表达式,以匹配一次不适合多个属性
的
Unicode
字符
。例如,假设我希望搜索
字符串
中
的
所有
字符
同时存在: 这显然不起作用:/[\P{Lu}\P{Ll}\P{Nd}]/u 看来我需要一个合乎逻辑
的
内线
浏览 5
提问于2016-05-05
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券