首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >是否从Java中的字符串中删除所有非“word字符”,而保留重音字符?

是否从Java中的字符串中删除所有非“word字符”,而保留重音字符?
EN

Stack Overflow用户
提问于 2009-10-23 16:01:24
回答 2查看 101.7K关注 0票数 68

显然,当我使用Regex时,Java的Regex风格将Umlauts和其他特殊字符算作非“单词字符”。

代码语言:javascript
复制
        "TESTÜTEST".replaceAll( "\\W", "" )

为我返回"TESTTEST“我想要的是只删除所有真正的非“单词字符”。有什么方法可以做到这一点,而不是像下面这样

代码语言:javascript
复制
         "[^A-Za-z0-9äöüÄÖÜßéèáàúùóò]"

才意识到我忘记了?

EN

回答 2

Stack Overflow用户

发布于 2009-10-23 16:05:43

好吧,这是我最终得到的一个解决方案,但我希望有一个更优雅的……

代码语言:javascript
复制
StringBuilder result = new StringBuilder();
for(int i=0; i<name.length(); i++) {
    char tmpChar = name.charAt( i );
    if (Character.isLetterOrDigit( tmpChar) || tmpChar == '_' ) {
        result.append( tmpChar );
    }
}

result最终得到了想要的结果...

票数 2
EN

Stack Overflow用户

发布于 2011-02-23 06:20:29

你可能想要remove the accents and diacritic signs first,然后在每个字符位置检查“简化”字符串是否是ascii字母-如果是,原始位置应包含单词字符,如果不是,则可以删除。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1611979

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档