每日算法系列【LeetCode 943】最短超级串
题目描述
给定一个字符串数组 A,找到以 A 中每个字符串作为子字符串的最短字符串。
我们可以假设 A 中没有字符串是 A 中另一个字符串的子字符串。
示例1
输入:
["alex","loves","leetcode"]
输出:
"alexlovesleetcode"
解释:
"alex","loves","leetcode" 的所有排列都会被接受。
示例2
输入:
["catg","ctaagt","gcta","ttca","atgcatc"]
输出:
"gctaagttcatgcatc"
提示
- 1 <= A.length <= 12
- 1 <= A[i].length <= 20
题解
这是每日算法系列更新以来,做过最难的一道题目了,也是第一次涉及到字符串类型的题目。如果觉得难,可以忽略今天这题。
这题意思就是,给你 n 个字符串,任意两个字符串如果拼接在一起的话,首尾可能会有重合的部分,那么就按照最长的重合部分拼接上去。要求的是 n 个字符串怎么排列,然后依次拼接,得到的最终字符串长度最短?
最暴力的方法当然就是枚举所有排列,然后把他们拼起来看长度,这样的话光是阶乘的复杂度就不可接受了。
这题就要用到状态压缩动态规划了,按照字面意思理解就是动态规划的状态是经过压缩的,那具体什么意思呢?
首先我们用二进制来表示每个字符串选取状态, 1 表示选取, 0 表示没有选取。比如 4 个字符串 ,我们选取了第 0 个和第 2 个,那么我们就可以用 1010 来表示这个选取状态,而 1010 转化成 10 进制就是 10 ,所以我们就可以用 10 这个数字来表示这种选取状态。状态最小值是 0 ,表示一个都没有选取,最大值是 ,表示所有的字符串都选取了。
然后定义 表示选取状态为 s 的情况下,最后一个字符串是第 i 个的情况下,最短的长度是多少。那么去掉第 i 个字符串,选取状态就变成了 ,其中 表示异或操作。然后遍历所有的 ,也就是看前一个状态以哪个字符串结尾长度最短。那么状态更新就是:
其中 表示 和 最大重合的长度,可以预处理出来。
与此同时,我们还需要一个数组 ,用来保存 s 状态下结尾是 时,前一个字符串最优是哪个。在做完动态规划之后,再进行回溯,找出整个最优序列是什么。
代码
c++
class Solution {
public:
string shortestSuperstring(vector<string>& A) {
const int INF = 0x3f3f3f3f;
int n = A.size(), M = (1<<n);
int o[n][n];
for (int i = 0; i < n; ++i) {
for (int j = 0; j < n; ++j) {
o[i][j] = overlap(A[i], A[j]);
}
}
int dp[M][n], path[M][n];
memset(dp, INF, sizeof dp);
memset(path, 0, sizeof path);
for (int i = 0; i < n; ++i) {
dp[1<<i][i] = A[i].size();
}
for (int s = 0; s < M; ++s) {
for (int i = 0; i < n; ++i) {
if ((s^(1<<i)) == 0) continue;
for (int j = 0; j < n; ++j) {
if (i != j && ((s>>j)&1)) {
if (dp[s][i] > dp[s^(1<<i)][j]+A[i].size()-o[j][i]) {
dp[s][i] = dp[s^(1<<i)][j]+A[i].size()-o[j][i];
path[s][i] = j;
}
}
}
}
}
int last = 0;
for (int i = 1; i < n; ++i) {
if (dp[M-1][i] < dp[M-1][last]) {
last = i;
}
}
vector<int> seq = {last};
int s = M - 1;
for (int i = 0; i < n-1; ++i) {
int tmp = last;
last = path[s][last];
seq.push_back(last);
s = s^(1<<tmp);
}
reverse(seq.begin(), seq.end());
string res = A[seq[0]];
for (int i = 1; i < n; ++i) {
res += A[seq[i]].substr(o[seq[i-1]][seq[i]]);
}
return res;
}
int overlap(const string& a, const string& b) {
int na = a.size(), nb = b.size();
for (int i = min(na, nb); i >= 1 ; --i) {
if (a.substr(na-i) == b.substr(0, i)) return i;
}
return 0;
}
};
python
class Solution:
def overlap(self, a, b):
na, nb = len(a), len(b)
for i in range(min(na, nb), 0, -1):
if a[na-i:] == b[0:i]:
return i
return 0
def shortestSuperstring(self, A: List[str]) -> str:
INF = 0x3f3f3f3f
n= len(A)
M = 1<<n
o = [[0] * n for _ in range(n)]
for i in range(n):
for j in range(n):
o[i][j] = self.overlap(A[i], A[j])
dp = [[INF] * n for _ in range(M)]
path = [[0] * n for _ in range(M)]
for i in range(n):
dp[1<<i][i] = len(A[i])
for s in range(M):
for i in range(n):
if s^(1<<i) == 0:
continue
for j in range(n):
if i != j and ((s>>j)&1):
if dp[s][i] > dp[s^(1<<i)][j]+len(A[i])-o[j][i]:
dp[s][i] = dp[s^(1<<i)][j]+len(A[i])-o[j][i]
path[s][i] = j
last = 0
for i in range(1, n):
if dp[M-1][i] < dp[M-1][last]:
last = i
seq = [last]
s = M - 1
for _ in range(n-1):
tmp = last
last = path[s][last]
seq.append(last)
s = s^(1<<tmp)
seq = seq[::-1]
res = A[seq[0]]
for i in range(1, n):
res += A[seq[i]][o[seq[i-1]][seq[i]]:]
return res
后记
这题还是有点难度的,我还是看了答案后才自己写出来的,如果实在不会,不要勉强。
公众号「算法码上来」。godweiyang带你学习算法,不管是编程算法,还是深度学习、自然语言处理算法都一网打尽,更有各种计算机新鲜知识和你分享。别急,算法码上来。