编辑距离

题目描述

给你两个单词 word1word2,请返回将 word1 转换成 word2 所使用的最少操作数。

你可以对一个单词进行如下三种操作:

  • 插入一个字符
  • 删除一个字符
  • 替换一个字符

示例

示例 1:

1
2
3
4
5
6
输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')

示例 2:

1
2
3
4
5
6
7
8
输入:word1 = "intention", word2 = "execution"
输出:5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')

提示

  • 0 <= word1.length, word2.length <= 500
  • word1word2 由小写英文字母组成

解题思路

这是一道经典的动态规划问题。

核心思想

定义 dp[i][j] 表示:将 word1[0:i] 转换成 word2[0:j] 的最少操作数。

换句话说,就是word1i 个字符 变成 word2j 个字符

状态转移方程

对于当前位置 dp[i][j],我们需要考虑以下四种情况:

  1. 删除操作:删除 word1 的第 i 个字符(即 word1[i-1]
    $$dp[i][j] = dp[i-1][j] + 1$$

  2. 插入操作:在 word1 中插入 word2 的第 j 个字符(即 word2[j-1]
    $$dp[i][j] = dp[i][j-1] + 1$$

  3. 替换操作word1[i-1]word2[j-1] 不匹配,需要替换
    $$dp[i][j] = dp[i-1][j-1] + 1$$

  4. 无需操作word1[i-1]word2[j-1] 匹配,无需任何操作
    $$dp[i][j] = dp[i-1][j-1]$$

综合以上情况:

$$
dp[i][j] =
\begin{cases}
dp[i-1][j-1] & \text{当 } word1[i-1] = word2[j-1] \
\min(dp[i-1][j] + 1, dp[i][j-1] + 1, dp[i-1][j-1] + 1) & \text{当 } word1[i-1] \neq word2[j-1]
\end{cases}
$$

边界条件

  • i 为 0 时,dp[0][j] 表示将空字符串转换为 word2[0:j],需要进行 j 次插入操作。
  • j 为 0 时,dp[i][0] 表示将 word1[0:i] 转换为空字符串,需要进行 i 次删除操作。

代码实现

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
class Solution:
def minDistance(self, word1: str, word2: str) -> int:
n, m = len(word1), len(word2)
dp = [[0] * (m+1) for _ in range(n+1)]
for i in range(n+1):
dp[i][0] = i
for i in range(m+1):
dp[0][i] = i
for i in range(1, n+1):
for j in range(1, m+1):
if word1[i-1] == word2[j-1]:
dp[i][j] = dp[i-1][j-1]
else:
dp[i][j] = min(
dp[i-1][j],
dp[i][j-1],
dp[i-1][j-1]
) + 1
return dp[n][m]