00:00
好,接下来呢,我们来看一看这个四点一点官方提供提供的这个沃尔康的案例,刚才我们讲的是加EP。那这个word count案例我告诉你。他这。像棉花糖一样,他从现在开始,一直到你毕业结束。无时无刻伴随着这个烫。到处都是这个压力。啊,这个案例是非常之经典,包括你在面试的时候。面试官让你手写的代码,80%都是他。上来呢?来手写一个word。有排毒在,你说也排毒不大啊。怎么让你手写SPA的?都有。所以这个沃尔哈米亚利非常的经典啊,他能做很多事情。看看我看什么叫我看看呢?是不是统计单词的个数啊?这是统计单词的个数,你有没有想过?
01:00
那我要统计某一类商品。他卖了多少个?跟这个有区别吗?其实是本质是没有任何区别的。然后统计,所有只要涉及到统计汇总的东西,基本上跟这个沃尔原理上都是相似的。所以说为什么他这么经典?就在这儿,那我们来看一看它能怎么静电啊?先带大家过一遍这个。那个要做的一个流程哈。首先呢是创建一个输入文件夹。啊,因为在这个后面大数据案例当中,所有的代码全部必须有输入路径和输出路径。再创建一个他。那在这里面呢,创建一个WC点一铺的一个文件。之后呢,把它在里面放一些单词。保证进出。之后我们就可以运行官方给我们提供的这个沃尔康的案例,你看啊,依然是开拓价。
02:07
啊,这个价呢,还是赛尔下的这个迈尔斯詹茅斯,只不过这一块变了,变成了霍尔哈。那这个work呢,它要求有一个输入。这个是辅助金,并不再需要政治的老师。就搞定了啊。最后就可以查看相应的统计单词出现的个数。看排毒出现了两次。选两次。89V5呢出现两次。就干这么一件事。其实这个呢,就相当于你在大量的这个日志当中啊,统计某一条日志啊,这个出现的次数最多,或者呢,统计某一个关键词,搜索的关键词最多。啊,他出现多少次。一些敏感词汇,十大热门,这个排行啊等等,这些都是通过这个沃的这种原理去实现的啊。
03:00
那下面我们具体来说一下。来这。但依然呢?创建一个文件夹,Make DR WC。进到那个咱铺的下面去。创建一个文件啊,当时C点就不能文件。这个名字呢,可以随便起啊。然后VMWC2。一按黑键就搞定了。进来。进来之后呢,里边有几个风云人物是吧。第一个就是填一个。还有谁呢?回到。还有呢?还有呢?章程。还有谁呢?一想到我就有阴影。啊,里边还有一个比较帅的啊,解释我那个叫心语是吧。
04:05
中国是吧?来两次我吗?还有这个今天这个高阳是吧。里边还有一个女神是吧?眼眼眼镜是吧。咋的?你不服啊?你说她不美吗?看你包括今天晚上。好,那这么多这个风云人物啊,那接下来我们看一看啊看一看。搞定这个呢,是所有的输入文件啊,我们退出来。来到这儿。聊这之后呢,下面我们开始运行我们的程序,那就是还吗加要一起加号在哪里呢?还六。还做吧,那不就是一个在公司。
05:02
这个一个糟糕师中的哪一个呢,Word。那么这个word上输入文件是哪一个呢?C。最终输出的结果要放到哪呢?打C啊。这个名字输出文文件这个名字啊,是任意取的啊,任意取取什么都行啊,但是一般呢是键名是一。OK,开始执行走。这就搞定了啊,搞定之后呢,我们进到这个达C啊进来。依然是两个文件啊,开了一下。在里边复印人物高阳两次啊。先播两次。这个是。眼镜两次对吧,啊,其他的都各一次。这个呢就是统计某一个单词出现的个数,现在呢是统计个数,你想一想,后面我们还有手段对它进行按照它。
06:03
进行一个排序。来一个TOP10对吧。很容易的啊,TOP10了一个TOP3。还是来一个TOP100,包括今天我给大家看那个。只有级统计那个每个城市大数据的岗位是不是来一个超时啊。第一是北京,第二是。推荐码。深圳,然后上海广州等等,那就是TOP10啊,基本上都是采用真实的,我先给你统计出来之后来一个到具台。啊,就这么简单。哎呀,这个是我的烫塔。
我来说两句