木又同学2020年第36篇解题报告
leetcode第72题:编辑距离
https://leetcode-cn.com/problems/edit-distance
【题目】
给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。
你可以对一个单词进行如下三种操作:
插入一个字符 删除一个字符 替换一个字符
示例 1:
输入: word1 = "horse", word2 = "ros"
输出: 3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')
示例 2:
输入: word1 = "intention", word2 = "execution"
输出: 5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')
【思路】
这是非常典型的动态规划题目,也是NLP的一个基础算法。
我们使用dis二维数组进行存储,dis[i][j]代表word1[0: i]和word2[0: j]的编辑距离
word1[i] == word[j]时,word1[0: i]和word2[0: j]的编辑距离也就是word1[0: i-1]和word2[0: j-1]的编辑距离,即dis[i][j] = dis[i-1][j-1]
word1[i] != word[j]时,dis[i][j] = dis[i][j-1] + 1表示word2删除一个元素;dis[i][j] = dis[i - 1][j] + 1表示word2增加一个元素;dis[i][j] = dis[i - 1][j - 1] + 1表示word2替换一个元素。因此,dis[i][j] = min(dis[i-1][j-1], dis[i][j-1], dis[i-1][j]) + 1
【代码】
python版本
class Solution(object):
def minDistance(self, word1, word2):
"""
:type word1: str
:type word2: str
:rtype: int
"""
dis = [[0] * (len(word2) + 1) for i in range(len(word1) + 1)]
dis[0] = [i for i in range(len(word2) + 1)]
for i in range(1, len(word1) + 1):
dis[i][0] = i
for j in range(1, len(word2) + 1):
# word1[i - 1] == word2[j - 1],w[0,...,i]与w2[0,...,j]编辑距离等于w[0,...,i-1]与w2[0,...,j-1]的
if word1[i - 1] == word2[j - 1]:
dis[i][j] = dis[i - 1][j - 1]
# 否则,等于相邻三个值的最小值+1
else:
dis[i][j] = min(dis[i - 1][j], dis[i][j - 1], dis[i - 1][j - 1]) + 1
return dis[-1][-1]