有人知道JavaScript的UAX #29,Unicode文本分割实现吗?我对字界特别感兴趣。
当我遇到XRegExp时,我满怀希望,但它似乎使用了\b
的标准JavaScript实现。
发布于 2017-12-30 11:35:13
https://github.com/orling/grapheme-splitter是UAX #29图形素簇边界的纯js实现。
还有一个关于使用UAX #29实现Intl.Segmenter的ES建议,请参阅https://github.com/tc39/proposal-intl-segmenter。
发布于 2016-07-26 14:02:34
https://www.npmjs.com/package/node-word-boundaries是其中之一,但对于某些unix原生unicode库,它需要节点;它不是纯js。
https://stackoverflow.com/questions/23470062
复制相似问题