前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >每日算法系列【LeetCode 943】最短超级串

每日算法系列【LeetCode 943】最短超级串

作者头像
godweiyang
发布2020-03-24 10:44:38
3420
发布2020-03-24 10:44:38
举报

题目描述

给定一个字符串数组 A,找到以 A 中每个字符串作为子字符串的最短字符串。

我们可以假设 A 中没有字符串是 A 中另一个字符串的子字符串。

示例1

输入:
["alex","loves","leetcode"]
输出:
"alexlovesleetcode"
解释:
"alex","loves","leetcode" 的所有排列都会被接受。

示例2

输入:
["catg","ctaagt","gcta","ttca","atgcatc"]
输出:
"gctaagttcatgcatc"

提示

  • 1 <= A.length <= 12
  • 1 <= A[i].length <= 20

题解

这是每日算法系列更新以来,做过最难的一道题目了,也是第一次涉及到字符串类型的题目。如果觉得难,可以忽略今天这题。

这题意思就是,给你 n 个字符串,任意两个字符串如果拼接在一起的话,首尾可能会有重合的部分,那么就按照最长的重合部分拼接上去。要求的是 n 个字符串怎么排列,然后依次拼接,得到的最终字符串长度最短?

最暴力的方法当然就是枚举所有排列,然后把他们拼起来看长度,这样的话光是阶乘的复杂度就不可接受了。

这题就要用到状态压缩动态规划了,按照字面意思理解就是动态规划的状态是经过压缩的,那具体什么意思呢?

首先我们用二进制来表示每个字符串选取状态, 1 表示选取, 0 表示没有选取。比如 4 个字符串 ,我们选取了第 0 个和第 2 个,那么我们就可以用 1010 来表示这个选取状态,而 1010 转化成 10 进制就是 10 ,所以我们就可以用 10 这个数字来表示这种选取状态。状态最小值是 0 ,表示一个都没有选取,最大值是 ,表示所有的字符串都选取了。

然后定义 表示选取状态为 s 的情况下,最后一个字符串是第 i 个的情况下,最短的长度是多少。那么去掉第 i 个字符串,选取状态就变成了 ,其中 表示异或操作。然后遍历所有的 ,也就是看前一个状态以哪个字符串结尾长度最短。那么状态更新就是:

其中 表示 和 最大重合的长度,可以预处理出来。

与此同时,我们还需要一个数组 ,用来保存 s 状态下结尾是 时,前一个字符串最优是哪个。在做完动态规划之后,再进行回溯,找出整个最优序列是什么。

代码

c++

class Solution {
public:
    string shortestSuperstring(vector<string>& A) {
        const int INF = 0x3f3f3f3f;
        int n = A.size(), M = (1<<n);
        int o[n][n];
        for (int i = 0; i < n; ++i) {
            for (int j = 0; j < n; ++j) {
                o[i][j] = overlap(A[i], A[j]);
            }
        }
        int dp[M][n], path[M][n];
        memset(dp, INF, sizeof dp);
        memset(path, 0, sizeof path);
        for (int i = 0; i < n; ++i) {
            dp[1<<i][i] = A[i].size();
        }
        for (int s = 0; s < M; ++s) {
            for (int i = 0; i < n; ++i) {
                if ((s^(1<<i)) == 0) continue;
                for (int j = 0; j < n; ++j) {
                    if (i != j && ((s>>j)&1)) {
                        if (dp[s][i] > dp[s^(1<<i)][j]+A[i].size()-o[j][i]) {
                            dp[s][i] = dp[s^(1<<i)][j]+A[i].size()-o[j][i];
                            path[s][i] = j;
                        }
                    }
                }
            }
        }
        int last = 0;
        for (int i = 1; i < n; ++i) {
            if (dp[M-1][i] < dp[M-1][last]) {
                last = i;
            }
        }
        vector<int> seq = {last};
        int s = M - 1;
        for (int i = 0; i < n-1; ++i) {
            int tmp = last;
            last = path[s][last];
            seq.push_back(last);
            s = s^(1<<tmp);
        }
        reverse(seq.begin(), seq.end());
        string res = A[seq[0]];
        for (int i = 1; i < n; ++i) {
            res += A[seq[i]].substr(o[seq[i-1]][seq[i]]);
        }
        return res;
    }

    int overlap(const string& a, const string& b) {
        int na = a.size(), nb = b.size();
        for (int i = min(na, nb); i >= 1 ; --i) {
            if (a.substr(na-i) == b.substr(0, i)) return i;
        }
        return 0;
    }
};

python

class Solution:
    def overlap(self, a, b):
        na, nb = len(a), len(b)
        for i in range(min(na, nb), 0, -1):
            if a[na-i:] == b[0:i]:
                return i
        return 0

    def shortestSuperstring(self, A: List[str]) -> str:
        INF = 0x3f3f3f3f
        n= len(A)
        M = 1<<n
        o = [[0] * n for _ in range(n)]
        for i in range(n):
            for j in range(n):
                o[i][j] = self.overlap(A[i], A[j])
        dp = [[INF] * n for _ in range(M)]
        path = [[0] * n for _ in range(M)]
        for i in range(n):
            dp[1<<i][i] = len(A[i])
        for s in range(M):
            for i in range(n):
                if s^(1<<i) == 0:
                    continue
                for j in range(n):
                    if i != j and ((s>>j)&1):
                        if dp[s][i] > dp[s^(1<<i)][j]+len(A[i])-o[j][i]:
                            dp[s][i] = dp[s^(1<<i)][j]+len(A[i])-o[j][i]
                            path[s][i] = j
        last = 0
        for i in range(1, n):
            if dp[M-1][i] < dp[M-1][last]:
                last = i
        seq = [last]
        s = M - 1
        for _ in range(n-1):
            tmp = last
            last = path[s][last]
            seq.append(last)
            s = s^(1<<tmp)
        seq = seq[::-1]
        res = A[seq[0]]
        for i in range(1, n):
            res += A[seq[i]][o[seq[i-1]][seq[i]]:]
        return res

后记

这题还是有点难度的,我还是看了答案后才自己写出来的,如果实在不会,不要勉强。

作者简介:godweiyang知乎同名华东师范大学计算机系硕士在读,方向自然语言处理与深度学习。喜欢与人分享技术与知识,期待与你的进一步交流~

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-01-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 算法码上来 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 题目描述
  • 题解
  • 代码
    • c++
      • python
      • 后记
      相关产品与服务
      文件存储
      文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档