洛谷 P1308 统计单词数【字符串+模拟】

P1308 统计单词数

题目描述

一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数。

现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给定的文章中出现的次数和第一次出现的位置。注意:匹配单词时,不区分大小写,但要求完全匹配,即给定单词必须与文章

中的某一独立单词在不区分大小写的情况下完全相同(参见样例1 ),如果给定单词仅是文章中某一单词的一部分则不算匹配(参见样例2 )。

输入输出格式

输入格式:

输入文件名为stat.in ,2 行。

第1 行为一个字符串,其中只含字母,表示给定单词;

第2 行为一个字符串,其中只可能包含字母和空格,表示给定的文章。

输出格式:

输出文件名为stat.out 。

只有一行,如果在文章中找到给定单词则输出两个整数,两个整数之间用一个空格隔开,分别是单词在文章中出现的次数和第一次出现的位置(即在文章中第一次出现时,单词首字母在文章中的位置,位置从 0 开始);如果单词在文章中没有出现,则直接输出一个整数-1。

输入输出样例

输入样例#1:

To 
to be or not to be is a question 

输出样例#1:

2 0

输入样例#2:

to 
Did the Ottoman Empire lose its power at that time

输出样例#2:

-1

说明

数据范围

1≤ 单词长度≤10。

1≤ 文章长度≤1,000,000。

noip2011普及组第2题

题目链接:https://www.luogu.org/problem/show?pid=1308

分析:这题卡的还是挺久的,半天不知道怎么处理单词,主要还是看清题目要求的格式:一共只有两行,第一行输入字母小于等于10个的单词(不可能会有空格),第二行输入文本(可能会有前导的空格),非正常输出-1(整数),正常输出两个整数(第一个为出现的次数,第二个为单词开头字母所占的位置,栽在这儿很长时间)。题目本身不难,关键是对于电脑读入的文本格式的把握,为此建议使用cin.peek()与cin.get()函数。

下面给出AC代码:

 1 #include <bits/stdc++.h>
 2 using namespace std;
 3 int main()
 4 {
 5     char temp;
 6     string str1,str2;
 7     int len=0;//len为单个字母长度
 8     int N=0,index=0;//N为单词出现次数,index为第一次出现的位置,
 9     cin>>str1;
10     while(cin.peek()!='\n')//去掉多余部分
11     {
12         cin.get();
13     }
14     cin.get();//拿走换行符
15     for(int i=0;str1[i]!='\0';i++)
16     {
17         if(str1[i]>='A'&&str1[i]<='Z')
18             str1[i]+=-'A'+'a';//转换为小写
19     }
20     bool count=0;//标记
21     while(cin.peek()!='\n')//结束条件为在第二行末尾输入了换行符
22     {
23         temp=cin.peek();//观察现在位置是否为空格
24         if(temp==' ')//如果是空格就取走
25         {
26             cin.get();
27             len++;//即便取走的是空格,位置也一定要加上
28             continue;
29         }
30         count=0;
31         cin>>str2;
32         len+=str2.size();//现在的位置
33         for(int i=0;str2[i]!='\0';i++)
34         {
35             if(str2[i]>='A'&&str2[i]<='Z')
36                 str2[i]+=-'A'+'a';//转换为小写
37         }
38         if(str1==str2)
39         {
40             N++;//次数+1
41             count=1;
42         }
43         if(count&&N==1)//两个逻辑条件保证index记录的一定是第一次出现时的位置
44             index=len-str2.size();
45     }
46     if(N==0)
47         cout<<N-1;//未找到输出整数-1
48     else
49         cout<<N<<" "<<index;//输出数据
50     return 0;
51 }

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据和云

算法分析:Oracle 11g 中基于哈希算法对唯一值数(NDV)的估算

1 为什么引入新 NDV 算法 字段的统计数据是 CBO 优化器估算执行计划代价的重要依据。而字段的统计数据可以分为两类: 1. 概要统计数据:如 NDV 字段...

38670
来自专栏AI研习社

用数据说话:把自拍照变成毕加索名画 哪种算法最高效?

提起前段时间红遍朋友圈的 Prisma,可能许多朋友都还记忆犹新:输入一张自己的照片,再选一个 Prisma 内置的名画滤镜,几秒之后就能得到一张名画风的新照片...

349100
来自专栏AI研习社

【算法】机器学习算法实践 K均值聚类的实用技巧

本文作者为美国数据分析专家 Bilal Mahmood,他是用户数据分析平台 Bolt 的创始人之一。在本文中,他详细介绍了一种称为 K-Means Clust...

33460
来自专栏数据和云

未完待续:关于DB Link和SCN,你还需要知道的是...

前情回顾: 更新通报:Oracle修正了关于DB Link补丁的公告 解决方案:Oracle的DB Link问题及升级路线详述 预警揭秘:11.2.0.4前版必...

38770
来自专栏IT派

机器学习之集成学习

1. 关于集成学习的概念   集成学习是机器学习中一个非常重要且热门的分支,是用多个弱分类器构成一个强分类器,其哲学思想是“三个臭皮匠赛过诸葛亮”。一般的弱分类...

34860
来自专栏AI研习社

破译地震的密码?——机器学习算法有望实现地震的精确预测

编者按:本文由图普科技工程师翻译自《Machine-Learning Algorithm Predicts Laboratory Earthquakes》。作者...

37260
来自专栏AI研习社

哈佛神经机器翻译系统 OpenNMT 更新等 | 开发者头条

哈佛大学神经机器翻译系统 OpenNMT 新版本发布 癌症检测突破!谷歌深度学习算法的乳腺癌检测准确率超病理科大夫 两大 AI 平台联手!IBM Watson...

35780
来自专栏SDNLAB

脱坑神器,让你一步了解ODL控制器集群

一、控制器集群基本知识 1.1 Consensus一致性 Consensus一致性是指多个服务器在状态达成一致,但是在一个分布式系统中,因为各种意外可能,有的...

52670
来自专栏AI研习社

通过从零开始实现一个感知机模型,我学到了这些

编者按:本文源自作者 Jean-Nicholas Hould 的个人博客,他是一位来自加拿大蒙特利尔的数据科学家,具有丰富的研发和实践经验。本文节选自作者个人的...

36770
来自专栏开源项目

客户案例 | iGola CTO 讲述三年敏捷开发之路

编者按 本文为码云 Gitee 的优秀客户案例,iGola 从 2015 年开始便选择码云作为其官方代码托管平台,经历了码云多个版本的迭代并成为企业版的深度用户...

36280

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励