首页
学习
活动
专区
工具
TVP
发布

字符串最短编辑距离问题

问题:

设 A 和 B 是两个字符串。我们要用最少的字符操作次数,将字符串 A 转换为字符串 B 。这里所说的字符操作共有三种:

删除一个字符;

插入一个字符;

将一个字符改为另一个字符。

对任给的两个字符串 A 和 B ,计算出将字符串 A 变换为字符串 B 所用的最少字符操作次数。

样例:

输出:

这个问题本质上是一个无向图的问题,固定了起点和终点,起点为字符串 A ,终点为字符串 B 。但是每一个点所对应的分支太多。所以我们需要对其进行转化。

在以下特殊情况下,最短编辑距离容易求出:

当 A 、 B 的长度都为 0 时,最短编辑距离为 0

当 A 的长度为 0 , B 的长度不为 0 ,最短编辑距离为 A 的长度

当 A 的长度不为 0 , B 的长度为 0 ,最短编辑距离为 B 的长度

我们可以将所有的字符串转化为以上的三种情况。

可以尝试使用动态规划来解决。动态规划对于有向无环图比较合适,如果我们只对字符串 A 、 B 的最后一个字符做操作,而且将“增删改”变为“删改”,那么无向图就变成了有向无环图。

使用动态规划,首先需要定义状态。我们可以把 A,B 变换成的子串的长度 看成一个状态,然后定义状态 的指标函数 为 变为相同子串所需的最小编辑次数。

然后观察不同状态之间是如何转移的,从状态 出发有三种决策,分别对应题目中所给出的三种字符操作(三种字符操作都是对最后一个字符的操作)。

删除一个字符 ==> 删除 A 字符串的最后一个字符,转移到了

插入一个字符 ==> 在 A 字符串末尾插入 B 字符串的一个字符,相当于 B 字符串删除一个字符,转移到了

将一个字符改为另一个字符。 ==> 将 A 的最后一个字符改为 B 的最后一个字符,将状态转移到了

则状态转移方程为:

式中,当子串的最后一个字符相同时, AB 的最小编辑距离与 AB 都去掉最后一个字母的最小编辑距离相同,所以 c=0 ,否则 c=1 。

C++完整程序:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180622G1NX5B00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券