前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >统计大文件中字符串出现的次数

统计大文件中字符串出现的次数

作者头像
opencode
发布2022-12-26 15:41:51
1.6K0
发布2022-12-26 15:41:51
举报
文章被收录于专栏:知识同步

面试场景题

如果有一个大文件,里面全是ip字符串,现在需要统计每个ip出现的次数,并且ip长度都挺长的,怎么在不使用map的情况下怎么统计,或者怎么优化

hashmap

要统计单词的次数,可以直接上map,但是可能字符会占挺多内存,这时候可以考虑字符转化为int之后再进行map,如果是ip字符串可以参考

字典树

力扣面试题 16.02. 单词频率

代码语言:javascript
复制
struct Trie{
    Trie* son[26];
    int cnt=0;
    Trie(){
        for(int i=0;i<26;i++){
            son[i]=nullptr;
        }
    }
};
class WordsFrequency {

private:
    Trie *root;
public:

    WordsFrequency(vector<string>& book) {
        root=new Trie();
        Trie* temp;
        for(auto item:book){
            temp = root;
            for(auto ch:item){
                int index=ch-'a';
                if(!temp->son[index]) temp->son[index]=new Trie();
                temp=temp->son[index];
            }
            ++temp->cnt;
        }
    }

    int get(string word) {
        Trie* temp=root;
        for(auto ch:word){
            int index=ch-'a';
            if(temp->son[index]) temp=temp->son[index];
            else return 0;
        }
        return temp->cnt;
    }
};
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021-09-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • hashmap
  • 字典树
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档