00:00
好,接下来呢,我们看一下那个官方的沃元宝。之前我们在讲入门的时候是不呃多次这个提到这个波放的啊。这个超级时代的使用啊,用来很爽,那我们看一看这个官方那个word,看看到底怎么写的。右键。姐。为了解压他,我就装了一个这个压缩文件。早上就使我这个课呀,就解解不了了。来,我们看一下这个赛尔啊。这个案例还在哪儿,知道吗?Sal拍度吧,就是。下面有一个。三是他吧,他。他之后我们看。OG阿帕奇拜杜马。张貌似。
01:01
一个华师里面有word。在这呢?这么沙发放的。看怎么拉出去。这是。他傻。太厉害了。一下出来了。看清楚了吗,这个。就是解压是吧,啊,要不解压一下,那这里面你看这个word案例,它整体有一个。Reducer还有一个,还有一个。那这三个代码是什么样的关系?我这有一个反编译工具。呃,反编译工具我在哪。资料里面有个他。我下了他,我电脑中了。这因为他下载的时候就是各种给你安装,就按那个软件我卸载那种是啊。
02:01
稍微下一下他,然后他就给你各种打包一堆软件。卖那个爱奇艺啊。360。啊,一堆。好,那我们来看啊,我这一拖拽就行了。成功,再就是这个word杠的那个案例。那这里面呢,首先有一个没方法对吧。备方法,备方法下面呢,有各种这个配置信息。其实这是一个驱动类,你看这里面有一个罩。以后呢,我们这个MR程序,它其实也叫一个兆。一个任务。都是一个事儿啊,一个。任务。那这里面呢,它设置了这个价啊by class。其实这个是设置这个架程序在什么位置啊,关联啊,后面我们再说啊你。大概看一眼这个整体,告诉你这是一个驱动函数,后面呢,属于这个标准的范式都这么写。
03:06
那你按照那个套路写就行了。那再往下呢,是这个这一个。下面有一个麦。我们先看这个map。这个呢,它继承了一个类叫。对吧,Micro类里面呢,有相应的参数四个参数。它其实呢是什么呢?这个呢是是输入数据的。练习。什么叫输入数据类型呢?比如说你要分析这个一个T里面的单词的个数。啊,那这个呢,就是输入的数据,那输入的数据呢,它是按行输入的。那第一个值就是。这一行数据的偏移量。什么叫偏移量呢?比如说你这儿从零开始,那。这呢,这个是到19。
04:01
19个字节,那下一行开始就是20。说到这儿呢,是。38。再下一行,39。是字节的一个偏移量啊,这么分。后面我会详细说一下,那再往后第二个呢,是这个输入的内容,其实就是一行一行的。OK,那后两个参数呢,是你输出数据的类型。呃,输出的类型是什么呢?输出呢,这里面其实我们是以单词为P。一个一个的单词。一个一个单词为P,因为我们是统计单词的师傅。啊,比如说统计18出现多少次。统计这个韩诺成人多少分啊?是一个一个的次数。那最主要的我想跟大家说什么呢?你看一下这里面的类型,我怎么感觉你们。不认识是吧。
05:00
根本就不认识,那这里面有test,有什么able,感觉似曾相识,是不是in的呢?是吧,哎。是这样的。啊,原因是什么呢?他这个MAP6,它对这个数据类型进行重新的一个序列化。在明天的,呃,明天的时候给大家详细讲一句话。拍动作当中的数据类型。这是Java什么类型的?这是中的数据类型。刚才我们看到的一个是派的对吧,那跟这个Java里类型对比的话,其实就是实例。只是对它进行一个序列化封装。变了个名字而已,那刚才我们看的这个able,其实在这个Java里面就是。只是这个封装完之后,这个数据呢,能进行一个序列化。这种类型啊,包括你看这个其实比较简单好记啊,只是后面加一个。
06:03
Be加一个be。烟台加烟。都是在后面的类型加了一个。唯独有一个特殊。他用的是特别广泛啊。特殊一点,加一个string,变成了test。仅此而已哈。啊,为了给大家看这源码,其实最主要的就是告诉大家这里面有这些数据类型啊。不太一样。重新封装好的。OK。那其他的你可以再看一看啊,这里面你看一共没写了几行代码。然后这个呢,是reduce里面。就完事了。那一会儿呢,我们一点一点的,一行一行的去给大家实现了。不是按照他这个去分啊。好,这个原码看到这。
我来说两句