前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【优选算法】滑动窗口——leetcode——438.找到字符串中所有字母异位词

【优选算法】滑动窗口——leetcode——438.找到字符串中所有字母异位词

作者头像
小李很执着
发布2024-08-05 09:45:04
900
发布2024-08-05 09:45:04
举报
文章被收录于专栏:学习笔记

专栏:优选算法

1.题目

438. 找到字符串中所有字母异位词

给定两个字符串 sp,找到 s 中所有 p异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。

异位词 指由相同字母重排列形成的字符串(包括相同的字符串)。

示例 1:

代码语言:javascript
复制
输入: s = "cbaebabacd", p = "abc"
输出: [0,6]
解释:
起始索引等于 0 的子串是 "cba", 它是 "abc" 的异位词。
起始索引等于 6 的子串是 "bac", 它是 "abc" 的异位词。

示例 2:

代码语言:javascript
复制
输入: s = "abab", p = "ab"
输出: [0,1,2]
解释:
起始索引等于 0 的子串是 "ab", 它是 "ab" 的异位词。
起始索引等于 1 的子串是 "ba", 它是 "ab" 的异位词。
起始索引等于 2 的子串是 "ab", 它是 "ab" 的异位词。

提示:

  • 1 <= s.length, p.length <= 3 * 104
  • sp 仅包含小写字母

2.题目理解

“abc”的异位词 有:abc,acb,bac,bca,cab,cba;

输出: [0,6](子串的起始索引)

3.算法原理

1.如何快速判断两个字符串是否是异位词

1.两个字符串都按照字符顺序排序,然后比较是否相等 排序+比较 nlogn +n

2.统计每个字符出现的次数 哈希表遍历比较

2.解决问题

暴力求解——>滑动窗口+哈希表

因为字符串p 的异位词的⻓度“m”⼀定与字符串p的⻓度相同,所以我们可以在字符串 s 中构 造⼀个⻓度为与字符串 p 的⻓度相同的滑动窗⼝,并在滑动中维护窗⼝中每种字⺟的数量;保持窗口大小一次遍历比较。

滑动窗口
利用滑动窗口+哈希表解决问题

可以⽤两个⼤⼩为 26 的数组来模拟哈希表,⼀个来保存 s 中的⼦串每个字符出现的个 数,另⼀个来保存 p 中每⼀个字符出现的个数。这样就能判断两个串是否是异位词。

优化:更新结果的判断条件

利用变化量count来统计窗口中“有效字符的次数”;

当窗⼝中每种字⺟的数量与字符串p中每种字⺟的数量相同时,则说明当前窗⼝为字符串 p 的异位词;

4.编程代码

C++代码

代码语言:javascript
复制
class Solution
{
public:
vector<int> findAnagrams(string s, string p)
{
vector<int> ret;
int hash1[26] = { 0 }; // 统计字符串 p 中每个字符出现的个数
for(auto ch : p) hash1[ch - 'a']++;
int hash2[26] = { 0 }; // 统计窗⼝⾥⾯的每⼀个字符出现的个数
int m = p.size();
for(int left = 0, right = 0, count = 0; right < s.size(); right++)
{
char in = s[right];
// 进窗⼝ + 维护 count
if(++hash2[in - 'a'] <= hash1[in - 'a']) count++;
if(right - left + 1 > m) // 判断
{
char out = s[left++];
// 出窗⼝ + 维护 count
if(hash2[out - 'a']-- <= hash1[out - 'a']) count--;
}
// 更新结果
if(count == m) ret.push_back(left);
}
return ret;
}
};
1.频率统计
代码语言:javascript
复制
for(auto ch : p) hash1[ch - 'a']++;
  • 范围 for 循环: 用于遍历字符串 p,并统计每个字符的出现次数。
  • 字符偏移量 ch - 'a': 将字符转换为数组索引,例如 'a' 对应 0'b' 对应 1
2. 双指针
  • 初始化指针和计数器 left, right, count: leftright 分别表示窗口的左边界和右边界,count 用于记录匹配字符的数量。
  • 滑动窗口 for 循环: 遍历字符串 s,右指针 right 不断向右移动。
  • 进窗口操作: 将 s[right] 加入窗口并更新频率数组 hash2。如果该字符的频率没有超过 hash1 中的频率,则计数器 count 加一。
  • 出窗口操作: 当窗口大小超过 m 时,将 s[left] 移出窗口,并更新频率数组 hash2 和计数器 count
  • 更新结果: 如果 count 等于 m,说明当前窗口是一个字母异位词,记录起始索引 left

C语言代码

代码语言:javascript
复制
int* findAnagrams(char * s, char * p, int* returnSize) {
    int s_len = strlen(s);  // 使用 strlen 计算字符串 s 的长度
    int p_len = strlen(p);  // 使用 strlen 计算字符串 p 的长度
    int *ret = (int *)malloc(s_len * sizeof(int));
    *returnSize = 0;

    int hash1[26] = {0}; // 统计字符串 p 中每个字符出现的个数
    for (int i = 0; i < p_len; i++) {
        hash1[p[i] - 'a']++;
    }

    int hash2[26] = {0}; // 统计窗口里面的每一个字符出现的个数
    int count = 0;
    for (int left = 0, right = 0; right < s_len; right++) {
        char in = s[right];
        // 进窗口 + 维护 count
        if (++hash2[in - 'a'] <= hash1[in - 'a']) {
            count++;
        }

        // 判断窗口是否超过大小
        if (right - left + 1 > p_len) {
            char out = s[left++];
            // 出窗口 + 维护 count
            if (hash2[out - 'a']-- <= hash1[out - 'a']) {
                count--;
            }
        }

        // 更新结果
        if (count == p_len) {
            ret[*returnSize] = left;
            (*returnSize)++;
        }
    }

    return ret;
}
1.字符频率统计
代码语言:javascript
复制
    int hash1[26] = {0}; // 统计字符串 p 中每个字符出现的个数
    for (int i = 0; i < p_len; i++) {
        hash1[p[i] - 'a']++;
    }
  • hash1:长度为26的整数数组,用于统计字符串p中每个字符的出现次数。hash1[i]表示字符'a' + i在字符串p中的出现次数。
  • 循环遍历字符串p,更新hash1数组。
2.滑动窗口机制
代码语言:javascript
复制
    int hash2[26] = {0}; // 统计窗口里面的每一个字符出现的个数
    int count = 0;
    for (int left = 0, right = 0; right < s_len; right++) {
        char in = s[right];
        // 进窗口 + 维护 count
        if (++hash2[in - 'a'] <= hash1[in - 'a']) {
            count++;
        }
  • hash2:长度为26的整数数组,用于统计滑动窗口内每个字符的出现次数。
  • count:记录当前滑动窗口内与字符串p中字符频率一致的字符数。
  • 滑动窗口通过right指针不断向右移动,将字符s[right]加入窗口,同时更新hash2数组和count计数。
3.判断窗口大小并维护窗口内字符频率
代码语言:javascript
复制
        // 判断窗口是否超过大小
        if (right - left + 1 > p_len) {
            char out = s[left++];
            // 出窗口 + 维护 count
            if (hash2[out - 'a']-- <= hash1[out - 'a']) {
                count--;
            }
        }
  • 检查滑动窗口的大小,如果窗口大小超过字符串p的长度(right - left + 1 > p_len),则需要移除窗口左侧的字符。
  • 更新left指针,移除窗口左侧字符,同时更新hash2数组和count计数。
4.更新结果
代码语言:javascript
复制
        // 更新结果
        if (count == p_len) {
            ret[*returnSize] = left;
            (*returnSize)++;
        }
    }

    return ret;
}
  • 如果count等于字符串p的长度,说明当前窗口内字符频率与字符串p一致,将left指针的值加入结果数组ret
  • 更新结果数组的大小*returnSize

C++知识点详解

  • STL(Standard Template Library): 向量 vector 是 STL 的一部分,提供动态数组的功能。
  • 范围 for 循环: C++11 引入的循环方式,简化了遍历操作。
  • 字符数组与频率统计: 使用数组来记录字符出现的频率,并进行简单的数学运算实现高效统计。
  • 双指针(Sliding Window)技巧: 通过两个指针控制一个窗口,用于高效地处理子串问题。
  • 成员函数与类: 通过类和成员函数组织代码,方便管理和调用。

1. STL(Standard Template Library)

向量 vector

概述vector 是 C++ 标准模板库(STL)中的一个动态数组,可以根据需要动态调整大小。

特点

  • 动态调整大小:vector 可以在运行时自动扩展和收缩。
  • 随机访问:支持使用索引进行随机访问,访问时间复杂度为 O(1)。
  • 内部实现:使用连续的内存块存储元素,类似于数组。

示例代码

代码语言:javascript
复制
#include <vector>
#include <iostream>

int main() {
    std::vector<int> vec = {1, 2, 3, 4, 5};
    
    // 添加元素到末尾
    vec.push_back(6);
    
    // 随机访问
    std::cout << "Element at index 2: " << vec[2] << std::endl;
    
    // 遍历向量
    for(int i : vec) {
        std::cout << i << " ";
    }
    
    return 0;
}

高级用法

插入和删除

代码语言:javascript
复制
#include <vector>
#include <iostream>

int main() {
    std::vector<int> vec = {1, 2, 3, 4, 5};
    
    // 在指定位置插入元素
    vec.insert(vec.begin() + 2, 99);
    
    // 删除指定位置的元素
    vec.erase(vec.begin() + 4);
    
    // 遍历向量
    for(int i : vec) {
        std::cout << i << " ";
    }
    
    return 0;
}

动态调整大小

代码语言:javascript
复制
#include <vector>
#include <iostream>

int main() {
    std::vector<int> vec(5, 10); // 创建一个大小为5的向量,初始值为10
    
    vec.resize(10, 20); // 调整向量大小为10,新增的元素值为20
    
    for(int i : vec) {
        std::cout << i << " ";
    }
    
    return 0;
}

2. 范围 for 循环

概述:范围 for 循环是 C++11 引入的一种简化遍历容器的方式。

特点

  • 简化代码:不需要显式地定义迭代器或索引变量。
  • 安全性:自动处理容器的边界,减少越界错误。

示例代码

代码语言:javascript
复制
#include <vector>
#include <iostream>

int main() {
    std::vector<int> vec = {1, 2, 3, 4, 5};
    
    for(int i : vec) {
        std::cout << i << " ";
    }
    
    return 0;
}

高级用法

使用引用遍历并修改元素

代码语言:javascript
复制
#include <vector>
#include <iostream>

int main() {
    std::vector<int> vec = {1, 2, 3, 4, 5};
    
    for(int& i : vec) {
        i *= 2; // 每个元素乘以2
    }
    
    for(const int& i : vec) {
        std::cout << i << " ";
    }
    
    return 0;
}

3. 字符数组与频率统计

概述:字符数组用于存储字符的频率信息,通常用于字符串相关的算法中。

实现:使用大小为 26 的数组来记录每个小写字母的出现次数,数组索引对应字母的偏移量(例如 'a' 对应索引 0,'b' 对应索引 1)。

特点

  • 高效:使用数组进行频率统计和比较,时间复杂度为 O(1)。
  • 简单:数组索引和字符的偏移量直接对应,易于实现和理解。

示例代码

代码语言:javascript
复制
#include <iostream>
#include <string>

int main() {
    std::string s = "hello";
    int freq[26] = {0};
    
    for(char ch : s) {
        freq[ch - 'a']++;
    }
    
    for(int i = 0; i < 26; ++i) {
        if (freq[i] > 0) {
            std::cout << (char)('a' + i) << ": " << freq[i] << std::endl;
        }
    }
    
    return 0;
}

高级用法

判断两个字符串是否是字母异位词

代码语言:javascript
复制
#include <iostream>
#include <string>
#include <algorithm>

bool isAnagram(std::string s1, std::string s2) {
    if (s1.size() != s2.size()) return false;
    
    int freq[26] = {0};
    
    for(char ch : s1) {
        freq[ch - 'a']++;
    }
    
    for(char ch : s2) {
        freq[ch - 'a']--;
    }
    
    for(int i = 0; i < 26; ++i) {
        if (freq[i] != 0) return false;
    }
    
    return true;
}

int main() {
    std::string s1 = "listen";
    std::string s2 = "silent";
    
    if (isAnagram(s1, s2)) {
        std::cout << s1 << " and " << s2 << " are anagrams." << std::endl;
    } else {
        std::cout << s1 << " and " << s2 << " are not anagrams." << std::endl;
    }
    
    return 0;
}

4. 双指针(Sliding Window)技巧

概述:双指针技术通常用于处理数组或字符串中的子数组或子串问题。

实现:使用两个指针(左指针和右指针)来维护一个窗口,该窗口在数组或字符串中滑动,以寻找满足特定条件的子数组或子串。

特点

  • 高效:通过调整指针位置来动态维护窗口,减少不必要的计算。
  • 灵活:可以用于解决多种问题,如最长子串、最短子串、子数组和等。

示例代码

代码语言:javascript
复制
#include <vector>
#include <iostream>

int main() {
    std::vector<int> nums = {1, 2, 3, 4, 5, 6};
    int left = 0, right = 0, sum = 0, target = 10;
    
    while(right < nums.size()) {
        sum += nums[right++];
        
        while(sum > target) {
            sum -= nums[left++];
        }
        
        if(sum == target) {
            std::cout << "Subarray found from index " << left << " to " << right - 1 << std::endl;
        }
    }
    
    return 0;
}

高级用法

找到所有和为给定值的子数组

代码语言:javascript
复制
#include <vector>
#include <iostream>

std::vector<std::pair<int, int>> findAllSubarrays(std::vector<int>& nums, int target) {
    std::vector<std::pair<int, int>> result;
    int left = 0, right = 0, sum = 0;
    
    while(right < nums.size()) {
        sum += nums[right++];
        
        while(sum > target) {
            sum -= nums[left++];
        }
        
        if(sum == target) {
            result.push_back({left, right - 1});
        }
    }
    
    return result;
}

int main() {
    std::vector<int> nums = {1, 2, 3, 4, 5, 6};
    int target = 10;
    
    std::vector<std::pair<int, int>> subarrays = findAllSubarrays(nums, target);
    
    for(auto& p : subarrays) {
        std::cout << "Subarray found from index " << p.first << " to " << p.second << std::endl;
    }
    
    return 0;
}

5. 成员函数与类

概述:类是 C++ 的基本面向对象编程(OOP)结构,用于封装数据和操作数据的方法。成员函数是类的函数,可以操作类的成员数据。

实现

  • 类定义:使用 class 关键字定义类,类中可以包含数据成员和成员函数。
  • 成员函数:在类的内部定义的方法,可以操作类的成员变量。
  • 访问控制:通过 public, protected, private 控制成员的访问权限。

特点

  • 封装性:将数据和操作封装在一起,提高代码的可维护性和可重用性。
  • 继承性:类可以通过继承复用已有代码。
  • 多态性:通过虚函数实现多态,提高代码的灵活性。

示例代码

代码语言:javascript
复制
#include <iostream>
#include <vector>
#include <string>

class Solution {
public:
    std::vector<int> findAnagrams(std::string s, std::string p) {
        std::vector<int> ret;
        int hash1[26] = { 0 };
        for(auto ch : p) hash1[ch - 'a']++;
        int hash2[26] = { 0 };
        int m = p.size();
        for(int left = 0, right = 0, count = 0; right < s.size(); right++) {
            char in = s[right];
            if(++hash2[in - 'a'] <= hash1[in - 'a']) count++;
            if(right - left + 1 > m) {
                char out = s[left++];
                if(hash2[out - 'a']-- <= hash1[out - 'a']) count--;
            }
            if(count == m) ret.push_back(left);
        }
        return ret;
    }
};

int main() {
    Solution solution;
    std::string s = "cbaebabacd";
    std::string p = "abc";
    std::vector<int> result = solution.findAnagrams(s, p);
    for(int index : result) {
        std::cout << index << " ";
    }
    return 0;
}

高级用法

类的继承

代码语言:javascript
复制
#include <iostream>

class Base {
public:
    void show() {
        std::cout << "Base class" << std::endl;
    }
};

class Derived : public Base {
public:
    void show() {
        std::cout << "Derived class" << std::endl;
    }
};

int main() {
    Base* basePtr;
    Derived derived;
    basePtr = &derived;
    
    basePtr->show(); // 调用基类的 show 方法
    derived.show();  // 调用派生类的 show 方法
    
    return 0;
}

虚函数与多态

代码语言:javascript
复制
#include <iostream>

class Base {
public:
    virtual void show() {
        std::cout << "Base class" << std::endl;
    }
};

class Derived : public Base {
public:
    void show() override {
        std::cout << "Derived class" << std::endl;
    }
};

int main() {
    Base* basePtr;
    Derived derived;
    basePtr = &derived;
    
    basePtr->show(); // 调用派生类的 show 方法,实现多态
    
    return 0;
}
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2024-07-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.题目
  • 2.题目理解
  • 3.算法原理
    • 1.如何快速判断两个字符串是否是异位词
      • 2.解决问题
        • 暴力求解——>滑动窗口+哈希表
        • 滑动窗口
        • 利用滑动窗口+哈希表解决问题
        • 优化:更新结果的判断条件
    • 4.编程代码
      • C++代码
        • 1.频率统计
        • 2. 双指针
      • C语言代码
        • 1.字符频率统计
        • 2.滑动窗口机制
        • 3.判断窗口大小并维护窗口内字符频率
        • 4.更新结果
    • C++知识点详解
      • 1. STL(Standard Template Library)
        • 2. 范围 for 循环
          • 3. 字符数组与频率统计
            • 4. 双指针(Sliding Window)技巧
              • 5. 成员函数与类
              相关产品与服务
              容器服务
              腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档