前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >企鹅QQ(字符串哈希)- BZOJ-3555

企鹅QQ(字符串哈希)- BZOJ-3555

作者头像
ACM算法日常
发布2018-08-07 17:02:08
3550
发布2018-08-07 17:02:08
举报
文章被收录于专栏:ACM算法日常ACM算法日常

PenguinQQ是中国最大、最具影响力的SNS(Social Networking Services)网站,以实名制为基础,为用户提供日志、群、即时通讯、相册、集市等丰富强大的互联网功能体验,满足用户对社交、资讯、娱乐、交易等多方面的需求。

小Q是PenguinQQ网站的管理员,他最近在进行一项有趣的研究——哪些账户是同一个人注册的。经过长时间的分析,小Q发现同一个人注册的账户名称总是很相似的,例如Penguin1,Penguin2,Penguin3……于是小Q决定先对这种相似的情形进行统计。

小Q定义,若两个账户名称是相似的,当且仅当这两个字符串等长且恰好只有一位不同。例如Penguin1和Penguin2是相似的,但Penguin1和2Penguin不是相似的。而小Q想知道,在给定的 个账户名称中,有多少对是相似的。

为了简化你的工作,小Q给你的 个字符串长度均等于 ,且只包含大小写字母、数字、下划线以及‘@’共64种字符,而且不存在两个相同的账户名称。

Input

第一行包含三个正整数 , , 。其中 表示账户名称数量, 表示账户名称长度, 用来表示字符集规模大小,它的值只可能为2或64。

若等于2,账户名称中只包含字符‘0’和‘1’共2种字符;

若等于64,账户名称中可能包含大小写字母、数字、下划线以及‘@’共64种字符。

随后行,每行一个长度为 的字符串,用来描述一个账户名称。数据保证 个字符串是两两不同的。

Output

仅一行一个正整数,表示共有多少对相似的账户名称。

Sample Input

4 3 64 Fax fax max mac

Sample Output

4

Hint

4对相似的字符串分别为:Fax与fax,Fax与max,fax与max,max与mac。N<=30000,L<=200,S<=64

思路:

对每个串都求一下哈希值,因为只有一位不同,所以可以枚举一下,将每个字符串删除同样位置的字符,然后排序比一下,要是有哈希值(已删去一个字符的)相等的,就算一对。详见代码:

源代码:G++

代码语言:javascript
复制
#include<cstdio>
#include<iostream>
#include<string>
#include<algorithm>

using namespace std;
typedef long long ll;//以下有爆掉的情况会自然溢出,超过ll自动对2^63取模
#define maxn 30005

const ll key = 457; //选一个大素数做种子
int n, m, s;
char str[maxn][205];
ll p[maxn] = {1}, a[maxn], sum[maxn][205];
ll ans;

void hash(int x, char *s) //为每个字符串都赋一个映射的哈希函数值,就像它的代号
{
    for (int i = 1; i <= m; i++) sum[x][i] = sum[x][i - 1] * key + s[i];
}
void cal(int j)
{
    for (int i = 1; i <= n; i++) //对每个串都删去当前的。因为上一轮哈希值已经减去前一个字符的哈希值了,这一轮要加回来
        a[i] = sum[i][m] - sum[i][j] * p[m - j] + sum[i][j - 1] * p[m - j + 1]; //这里p的应用,自己举个小例子画一画,把字符当成数字就好
    sort(a + 1, a + 1 + n);
    ll now = 1;
    for (int i = 2; i <= n; i++) //因为排过序了,所以直接比较前一个和后一个的值,相等就加一组。因为是总对数,对now的当前值直接往答案上加
        if (a[i] == a[i - 1]) ans += now, now++;
        else now = 1;
}
int main()
{
    scanf("%d%d%d", &n, &m, &s);
    for (int i = 1; i <= maxn; i++) //提前初始化一下p数组,p的使用方法配合之后的过程来体会
        p[i] = p[i - 1] * key;
    for (int i = 1; i <= n; i++) //hash计算一下
        scanf("%s", str[i] + 1), hash(i, str[i]);
    for (int i = 1; i <= m; i++) //枚举,删去下标为i的那个字符
        cal(i);
    printf("%lld", ans);
    return 0;
}
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-05-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ACM算法日常 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
即时通信 IM
即时通信 IM(Instant Messaging)基于腾讯二十余年的 IM 技术积累,支持Android、iOS、Mac、Windows、Web、H5、小程序平台且跨终端互通,低代码 UI 组件助您30分钟集成单聊、群聊、关系链、消息漫游、群组管理、资料管理、直播弹幕和内容审核等能力。适用于直播互动、电商带货、客服咨询、社交沟通、在线课程、企业办公、互动游戏、医疗健康等场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档