前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >LeetCode 187. 重复的DNA序列(哈希/位运算)

LeetCode 187. 重复的DNA序列(哈希/位运算)

作者头像
Michael阿明
发布2020-07-13 14:27:07
5190
发布2020-07-13 14:27:07
举报

1. 题目

所有 DNA 都由一系列缩写为 A,C,G 和 T 的核苷酸组成,例如:“ACGAATTCCG”。 在研究 DNA 时,识别 DNA 中的重复序列有时会对研究非常有帮助。

编写一个函数来查找 DNA 分子中所有出现超过一次10 个字母长的序列(子串)。

代码语言:javascript
复制
示例:
输入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
输出:["AAAAACCCCC", "CCCCCAAAAA"]

来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/repeated-dna-sequences 著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

2. 解题

2.1 哈希

代码语言:javascript
复制
class Solution {
public:
    vector<string> findRepeatedDnaSequences(string s) {
		if(s.size() <= 10)
			return {};
    	unordered_map<string,int> m;
    	int i = 0;
    	while(i < s.size()-9)
    		m[s.substr(i++,10)]++;
    	vector<string> ans;
    	for(auto it = m.begin(); it != m.end(); ++it)
    	{
    		if(it->second > 1)
    			ans.push_back(it->first);
    	}
    	return ans;
    }
};

120 ms 23.1 MB

2.2 位运算

  • 用0-3来表示四种字符,二进制只需要2位,总共20位即可表示10个字符
代码语言:javascript
复制
class Solution {
public:
    vector<string> findRepeatedDnaSequences(string s) {
		if(s.size() <= 10)
			return {};
    	map<char,int> m = {{'A',0}, {'G',1}, {'C',2}, {'T',3}};
        unordered_map<int,int> c;
        int num = 0, i = 0, k=10;
        while(i < k-1)
        {
            num <<= 2;
            num |= m[s[i++]];//生成前9位字符的二进制编码表示
        }
        vector<string> ans;
        while(i < s.size())
        {
            num = (num<<2)&~(3<<2*k);
            //num左移两位,3(11)移动20位,取反变成00,把出去的高位抹掉
            num |= m[s[i]];//加入后面进来的
            c[num]++;
            if(c[num]==2)//第二次出现,加入答案
                ans.push_back(s.substr(i-k+1,10));
            i++;
        }
        return ans;
    }
};

88 ms 14.9 MB

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-05-13 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 题目
  • 2. 解题
    • 2.1 哈希
      • 2.2 位运算
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档