我试图使用javascript代码在一些文本中找到URL。问题是,我使用的正则表达式使用\w来匹配URL中的字母和数字,但它不匹配非英语字符(在我的例子中是希伯来字母)。
那么,我可以用什么代替\w来匹配所有语言中的所有字母呢?
发布于 2018-09-27 13:19:05
我刚刚找到了尚未提及的XRegExp,我对此印象深刻。它是一个替代的正则表达式实现,具有unicode插件并且在MIT许可下获得许可。
根据该网站,为了匹配unicode字符,可以使用这样的代码:
var unicodeWord = XRegExp("^\\p{L}+$");
unicodeWord.test("Русский"); // true
unicodeWord.test("日本語"); // true
unicodeWord.test("العربية"); // true
发布于 2018-09-27 14:19:44
检查这个关于JavaScript和Unicode的SO问题。看起来Jan Goyvaerts的回答为你提供了一些希望。
编辑:但是,似乎所有浏览器都不支持\ p ...无论如何。那个问题应该包含有用的信息。
https://stackoverflow.com/questions/-100008878
复制相似问题