00:00
啊,接下来呢,我们开始写第一个啊,也就是说将这个输入数据啊。然后转换成这种输出。那么你想想,在卖部阶段我要做什么事情?首先这个文件的名称是不是得拿到啊,拿到了名称在什么方法里面拿。再大嘛,对吧,啊,那在map里面干什么。是不去切啊,哎,切割出一个一个单词,然后最终往出写的时候谁为P。单词加文件名称为K啊,然后value呢?是就的包这个个数啊。Member。
01:01
那第一个呢,是第二个呢。那接下来输出的K和Y分别是什么?他然后。In right啊,统计一下的次数啊好。那在这里面首先有一个set up在这里面干什么事?获取文件名称,OK。那下面来个麦克。那获取文件名称怎么获取啊?放点盖。眼部的。过去接电。那这个切片我们知道它是。
02:00
旋转一下。拿到它之后。点儿get pass点儿。Get内。把这个名称呢拿出去。那么第一步呢,就搞定了啊。搞定之后呢,下面呢,我们继续写它的map方法。卖方法呢,我们把这个数据拿过来一组啊。那这也出去啊,首先呢,那我们是不是依然是获取一行啊。获取一行,那这一行是不是Y6?点。那拿到这一行之后,那这一行的内容是不是他呀,那我说对它进行切割呀。
03:04
切割。切割的话就是line点。利特。我这个是按什么接。空格键。拿到它,拿到它之后就相当于我取出里面一个一个的单值了,倒数的循环变列啊。千万别再往出写啊。是words。那么这个word我最终是要跟这个文件名字拼在一起啊。拼成谁呀?拼车数这个K啊。拿来哈。又一个。这个呢,拿出去。
04:02
那这个P点赛的话就是单词加上啊。加上的话。文件名称是吧。文件名称是不是中间得有一个间隔呀?尴尬是下次用它去切。点right right的话就是。那Y6是不就是这个个数。个数需要new一个。那这个数据一。能理解吗?也就是说将这个K。封装成这个单词,加上这个文件的名称啊为K,然后value呢,其实就是统计累加它的次数。就OK了啊。
05:01
那这个麦结束之后,那下面呢,我们开始写它的reduce方法啊。那想想在这60阶段要干什么事情?汇总啊。跟沃尔看呢,没有什么区别。过来看看,现在还有不会的吗?可以手把手教你。那第一个呢,是test。看特吧。那最终输出是?In,干什么好?拿出来之后,那下面呢,就是累加求和。
06:06
发一起。那这个呢,是Y6。那累加求和就得有一个。上。Sum加等于value.get。求完之后是不是要封装到这个K里面去啊?封装到value里面嘛,Value里面啊。又一个inable。最终写出刚点,那它的K就是这个KV是它。呢,这个V啊塞一下。微赛撒。
07:04
了,这样呢就搞定了。累加求和,这个我相信大家都能正常的搞定啊。那剩下的就是驱动了是吧,把这个驱动类呢,我们拿过来。的驱动代码拿过来,这就是标准的。第一个导它的配置信息,然后是job信息。然后是累。
08:05
OK。结束了啊结束了,那输入的文件呢,在这里面啊,Input one index,然后输出呢,先输出到OUT5好看有没有啊。目前没有。那么右键运行。里面看一看啊,别这个说我骗你吧。在。A里面爱的硅谷平平凶手啊。B里面。三了。搞定之后呢,那我们来看一下啊右键。
09:01
要换电脑。啥情况?啊,看一下结果。没问题吧,哎,这个就对了吧,你看二我在A里面出现三次,B里面出现两次,C里面出现两次。就对了啊,这是第一阶段的结果,那下一阶段我们干什么?不切呀,哎,通过它切,切完之后,前面这个相同的,哎,这一行切完之后以它为K啊。后面剩下的是Y60啊。剩下的白流值都能进入到同一个reduce定方法里面去,那传到reduce方法里面去,剩下的事就拼接。那么接下来我们做第二步。
我来说两句