我完全不能使用正则表达式,所以我需要一些帮助来解决一个我认为最好使用正则表达式来解决的问题。
我在C#中有一个字符串列表:
List<string> lstNames = new List<string>();
lstNames.add("TRA-94:23");
lstNames.add("TRA-42:101");
lstNames.add("TRA-109:AD");
foreach (string n in lstNames) {
// logic goes here that somehow uses regex to remove all special characters
string regExp = "NO_IDEA";
string tmp = Regex.Replace(n, regExp, "");
}
我需要能够循环遍历列表,并返回没有任何特殊字符的每一项。例如,第一项将是"TRA9423",第二项将是"TRA42101“,第三项将是TRA109AD。
有没有一个正则表达式可以帮我做到这一点?
此外,该列表包含4000多个项目,所以我需要搜索和替换是有效的和快速的,如果可能的话。
编辑:我应该指定a-z,A-Z和0-9之外的任何字符在我的情况下都是特殊的。
发布于 2010-07-22 04:16:20
这真的取决于你对特殊字符的定义。我发现在大多数情况下,白名单比黑名单是最好的方法:
tmp = Regex.Replace(n, "[^0-9a-zA-Z]+", "");
您应该小心使用当前的方法,因为以下两项将被转换为相同的字符串,因此将无法区分:
"TRA-12:123"
"TRA-121:23"
发布于 2010-07-22 04:15:53
这应该可以做到:
[^a-zA-Z0-9]
基本上,它匹配所有非字母数字字符。
发布于 2010-07-22 04:16:56
[^a-zA-Z0-9]
是匹配任何非字母数字字符的字符类。
或者,[^\w\d]
也可以做同样的事情。
用法:
string regExp = "[^\w\d]";
string tmp = Regex.Replace(n, regExp, "");
https://stackoverflow.com/questions/3303420
复制相似问题