前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >算法:编辑距离(Levenshtein Distance)

算法:编辑距离(Levenshtein Distance)

作者头像
WEBJ2EE
发布2019-07-19 12:35:16
2K0
发布2019-07-19 12:35:16
举报
文章被收录于专栏:WebJ2EE

1. 什么是“编辑距离” ?

“编辑距离”又称 Leveinshtein 距离,是由俄罗斯科学家 Vladimir Levenshtein 在 1965 年提出。

“编辑距离”是计算两个文本相似度的算法之一,字符串 X 和字符串 Y 的编辑距离是将 X 转换成 Y 的最小操作次数,这里的操作包括三种:

  • 插入一个字符
  • 删除一个字符
  • 替换一个字符

例如:

kitten 和 sitting 的编辑距离是3。

  1. kitten -> sitten (k替换为s)
  2. sitten -> sittin (e替换为i)
  3. sittin -> sitting (插入g)

至少要做3次操作。

图文无关:从入门到放弃

2. 基本策略 ?

... 当然还是传说中的 ...

线性规划

图文无关

递推公式如下

3. 程序代码 ?

4. 特性分析

  • 时间复杂度:O(m*n)
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-03-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 WebJ2EE 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档