例如,我想要匹配一个由m
和n
中文字符组成的字符串,然后我可以使用:
[single Chinese character regular expression]{m,n}
是否存在单个中文字符的正则表达式,可以是任何存在的中文字符?
发布于 2014-06-04 11:20:24
在Java中,
\p{InCJK_UNIFIED_IDEOGRAPHS}{1,3}
发布于 2020-02-11 19:25:06
在C#中
new Regex(@"\p{IsCJKUnifiedIdeographs}")
这是the Microsoft docs格式的
更多信息来自维基百科:CJK Unified Ideographs
名为中日韩表意文字(4E00-9FFF)的基本区块包含U+4E00至U+9FEF范围内的20,976个基本汉字。该区块不仅包括中文书写系统中使用的字符,还包括日文书写系统中使用的汉字和在韩国使用正在减少的韩文。此块中的许多字符在所有三种书写系统中都使用,而其他字符仅在三种书写系统中的一种或两种中使用。越南的诺姆文字(现已过时)也使用汉字。
发布于 2021-01-19 19:12:23
刚刚解决了一个类似的问题,
当你有太多东西要匹配时,最好使用negated-set
并声明你不想匹配的东西,如下所示:
除数字以外的所有数字:^[^0-9]*$
第二个^
将实现求反
https://stackoverflow.com/questions/9576384
复制相似问题