因项目需要,需要将项目中所有的中文改为英文版本。故需要搜索项目中所有中文。用到的IDE为vscode
和IntelliJ IDEA
。
使用正则表达式进行匹配。
经查询中日韩统一表意文字(CJK Unified Ideographs)unicode范围是4E00
到9FFF
。
另一个常需要进行匹配的是中文的标点符号,经过查询,中文标点符号的范围是FF00
到FFFF
。
故可以使用下述正则表达式:
[\u4E00-\u9FFF]+
:中文文字匹配[\uFF00-\uFFFF]+
:中文标点符号匹配([\u4E00-\u9FFF]|[\uFF00-\uFFFF])+
:匹配中文或标点符号经测试,在vscode
和IntelliJ IDEA
都可以正常匹配。
注意:上述范围并不包含所有文字,CJK还包含A到H等8个扩展集。
参考资料:
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。