LCOF 19. 正则表达式匹配
1. 问题
请实现一个函数用来匹配包含 '.' 和 '*' 的正则表达式。模式中的字符 '.' 表示任意一个字符,而 '*' 表示它前面的字符可以出现任意次(含0次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串 "aaa" 与模式 "a.a" 和 "abaca" 匹配,但与 "aa.a" 和 "ab*a" 均不匹配。
示例 1:
输入:
s = "aa"
p = "a"
输出: false
解释: "a" 无法匹配 "aa" 整个字符串。
示例 2:
输入:
s = "aa"
p = "a*"
输出: true
解释: 因为 '*' 代表可以匹配零个或多个前面的那一个元素, 在这里前面的元素就是 'a'。因此,字符串 "aa" 可被视为 'a' 重复了一次。
示例 3:
输入:
s = "ab"
p = ".*"
输出: true
解释: ".*" 表示可匹配零个或多个('*')任意字符('.')。
示例 4:
输入:
s = "aab"
p = "c*a*b"
输出: true
解释: 因为 '*' 表示零个或多个,这里 'c' 为 0 个, 'a' 被重复一次。因此可以匹配字符串 "aab"。
示例 5:
输入:
s = "mississippi"
p = "mis*is*p*."
输出: false
s 可能为空,且只包含从 a-z 的小写字母。
p 可能为空,且只包含从 a-z 的小写字母以及字符 . 和 *,无连续的 '*'。
2. 解法 - 动态规划
还有一种递归解法,暂时搁置。
2.1 Java
class Solution {
public boolean isMatch(String A, String B) {
/**
* 解题思路
*
* 假设字符串为A,正则表达式为B,假设A的长度为n,B的长度为m 要判断A和B是否可以匹配,可以根据B的最后一个字符来分类讨论: 1.
* B的最后一个字符是普通字符,就只要看A[n-1]和B[m-1]是否相等 a.
* 若A[n-1]=B[m-1],那么就看A[0,n-2]和B[0,m-2]是否匹配 b. 若A[n-1]!=B[m-1],那么可以得出,A和B无法匹配 2.
* 若B的最后一个字符是「.」,由于它可以匹配任何字符,所以直接看A[0,n-2]和B[0,m-2]是否匹配 3.
* 若B的最后一个字符是「*」,假设B[m-2]=c,那么c可以重复0次或者多次,这些连续的c组合成为c* a.
* 如果A[n-1]不是c,那么B的最后两个字符就没有任何作用了,A和B能否匹配取决于A[0,n-1]和B[0,m-3]是否能匹配 b.
* 如果A[n-1]是多个c中的最后一个,这种情况下A[n-1]为c或者「.」,因为有多个c,所以A[n-1]匹配成功之后往前挪一个字符,继续看A[0,n-2]和B[0,m-1]是否匹配
*/
int n = A.length();
int m = B.length();
/**
* 状态数组 dp[i][j]表示A的前i个字符和B的前j个字符能否匹配成功
* 数组长度开[n+1][m+1],这样方便处理空串,题目所求结果就是dp[n][m]
*/
boolean[][] dp = new boolean[n + 1][m + 1];
/**
* 边界条件 1. 空字符串和空正则表达式,可匹配,dp[0][0]=true 2. 空字符串和非空正则表达式,不一定是false,需要推算,比如A=""
* B="a*b*c*"时就是匹配的 3. 非空字符串和空正则表达式,一定不匹配,dp[1][0]=dp[2][0]=...=dp[n][0]=false
* 4. 非空字符串和非空正则表达式,需要推算。
*/
dp[0][0] = true;
for (int i = 1; i <= n; i++) {
dp[i][0] = false;
}
// 状态转移
for (int i = 0; i <= n; i++) {
for (int j = 0; j <= m; j++) {
// 正则表达式为空,也就是j为0的边界情况都已经在上面赋值过了
// 正则表达式非空,j不为0
if (j != 0) {
// 正则表达式非空时,要分为两种情况,看B最后一个字符是不是「*」
// 若B最后一个字符不为「*」
if (B.charAt(j - 1) != '*') {
if (i >= 1 && (A.charAt(i - 1) == B.charAt(j - 1) || B.charAt(j - 1) == '.'))
dp[i][j] = dp[i - 1][j - 1];
} else {
// 若B最后一个字符为「*」,分两种情况,也就是解题思路中的3.a和3.b
// 碰到c*,如果不看*的话,那么正则表达式B的最后两个字符没有起作用,砍掉这两个字符
if (j >= 2)
dp[i][j] = dp[i][j - 2];
// 碰到c*,如果要看*的话,不管正则表达式B,字符串A往前移一个字符dp[i][j] = dp[i-1][j]
if (i >= 1 && j >= 2 && (A.charAt(i - 1) == B.charAt(j - 2) || B.charAt(j - 2) == '.'))
dp[i][j] |= dp[i - 1][j];
// 使用「 | 」是因为以上两种情况只要有一种情况匹配就算是匹配
}
}
}
}
return dp[n][m];
}
}
2.2 Kotlin
class Solution {
fun isMatch(A: String, B: String): Boolean {
/**
* 解题思路
*
* 假设字符串为A,正则表达式为B,假设A的长度为n,B的长度为m 要判断A和B是否可以匹配,可以根据B的最后一个字符来分类讨论: 1.
* B的最后一个字符是普通字符,就只要看A[n-1]和B[m-1]是否相等 a.
* 若A[n-1]=B[m-1],那么就看A[0,n-2]和B[0,m-2]是否匹配 b. 若A[n-1]!=B[m-1],那么可以得出,A和B无法匹配 2.
* 若B的最后一个字符是「.」,由于它可以匹配任何字符,所以直接看A[0,n-2]和B[0,m-2]是否匹配 3.
* 若B的最后一个字符是「*」,假设B[m-2]=c,那么c可以重复0次或者多次,这些连续的c组合成为c* a.
* 如果A[n-1]不是c,那么B的最后两个字符就没有任何作用了,A和B能否匹配取决于A[0,n-1]和B[0,m-3]是否能匹配 b.
* 如果A[n-1]是多个c中的最后一个,这种情况下A[n-1]为c或者「.」,因为有多个c,所以A[n-1]匹配成功之后往前挪一个字符,继续看A[0,n-2]和B[0,m-1]是否匹配
*/
val n = A.length
val m = B.length
/**
* 状态数组 dp[i][j]表示A的前i个字符和B的前j个字符能否匹配成功
* 数组长度开[n+1][m+1],这样方便处理空串,题目所求结果就是dp[n][m]
*/
val dp = Array(n + 1) { BooleanArray(m + 1) }
/**
* 边界条件 1. 空字符串和空正则表达式,可匹配,dp[0][0]=true 2. 空字符串和非空正则表达式,不一定是false,需要推算,比如A=""
* B="a*b*c*"时就是匹配的 3. 非空字符串和空正则表达式,一定不匹配,dp[1][0]=dp[2][0]=...=dp[n][0]=false
* 4. 非空字符串和非空正则表达式,需要推算。
*/
dp[0][0] = true
for (i in 1..n) {
dp[i][0] = false
}
// 状态转移
for (i in 0..n) {
for (j in 0..m) {
// 正则表达式为空,也就是j为0的边界情况都已经在上面赋值过了
// 正则表达式非空,j不为0
if (j != 0) {
// 正则表达式非空时,要分为两种情况,看B最后一个字符是不是「*」
// 若B最后一个字符不为「*」
if (B[j - 1] != '*') {
if (i >= 1 && (A[i - 1] == B[j - 1] || B[j - 1] == '.'))
dp[i][j] = dp[i - 1][j - 1]
} else {
// 若B最后一个字符为「*」,分两种情况,也就是解题思路中的3.a和3.b
// 碰到c*,如果不看*的话,那么正则表达式B的最后两个字符没有起作用,砍掉这两个字符
if (j >= 2)
dp[i][j] = dp[i][j - 2]
// 碰到c*,如果要看*的话,不管正则表达式B,字符串A往前移一个字符dp[i][j] = dp[i-1][j]
if (i >= 1 && j >= 2 && (A[i - 1] == B[j - 2] || B[j - 2] == '.'))
dp[i][j] = dp[i][j] or dp[i - 1][j]
// 使用「 | 」是因为以上两种情况只要有一种情况匹配就算是匹配
}
}
}
}
return dp[n][m]
}
}
3. 参考
最后更新于