首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >非英语字符串上的Levenshtein距离

非英语字符串上的Levenshtein距离
EN

Stack Overflow用户
提问于 2010-02-17 11:00:07
回答 3查看 2.9K关注 0票数 6

Levenshtein距离算法也适用于非英语字符串吗?

更新:当比较亚洲字符时,这在像这样的语言中会自动工作吗?

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2010-02-17 11:11:10

只有当语言是以字母为基础的。比如俄语德语..。但是象形文字(比如中国)或者音节(比如老挝)--不是。

票数 4
EN

Stack Overflow用户

发布于 2010-02-17 11:08:38

是。但是,您必须将非英语字符视为"1字符“,而不是多个字符(例如utf-8)。例如,在python中,您可以使用unicode类来表示字符串(和字符)。

票数 3
EN

Stack Overflow用户

发布于 2010-02-17 11:10:28

Levenshtein并不关心语言,它只是告诉您需要更改多少个字符(添加、删除、交换)才能从一个字符串得到另一个字符串。

所以:是的,但你必须检查你的字符集,一些外国的“单”字符,否则我会被视为两个(或更多)字符。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2280022

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档