首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >用elisp从字符串中删除大部分非字母字符。

用elisp从字符串中删除大部分非字母字符。
EN

Stack Overflow用户
提问于 2016-03-07 12:27:12
回答 2查看 1.1K关注 0票数 2

我需要从字符串中删除所有非字母字符和数字,但- _除外。

对于许多语言来说,一个流行的解决方案是使用类似于这个[^\\w\\-_]的东西,因为某种原因,这个表达式与replace-regexp-in-string一起使用时,删除了所有东西。

\\W删除除字母字符和数字之外的所有内容:

代码语言:javascript
运行
复制
(message (replace-regexp-in-string "\\W" "" "Set AA053 Лыв № foo_bar (设)"))

输出:SetAA053Лывfoobar设

a-zA-Z0-9不能解决我的问题,因为我需要保留非拉丁字符。

谢谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-03-08 08:58:51

POSIX类是特定于地区的,根据文档

‘[:alnum:]’ 这与任何字母或数字相匹配。(目前,对于多字节字符,它匹配任何具有单词语法.) ‘[:alpha:]’的字符。 这和任何字母都匹配。(目前的,对于多字节字符,它匹配任何具有单词语法的字符。)

这就是为什么要匹配任何不是字母、数字或下划线/连字符的字符,可以使用否定字符类解决方案:

在开始方括号后键入插入符号将否定字符类。结果是,字符类匹配任何不在字符类中的字符。

所以,是的,你可以

代码语言:javascript
运行
复制
"[^[:alnum:]_-]"
 ^^           ^

代码语言:javascript
运行
复制
"[^[:alpha:][:digit:]_-]"

regex引擎将字符类末尾的连字符视为文字连字符,而不是任何范围定义操作符。

如果您不关心_并想要替换它,请从字符类中删除。

票数 2
EN

Stack Overflow用户

发布于 2016-03-07 13:39:05

在@wiktorstribiżew的帮助下,我找到了正确的regexp:

[^[:alnum:]-_]

详情请参见https://www.gnu.org/software/emacs/manual/html_node/elisp/Char-Classes.html

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35843759

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档