00:00
好,接下来我们来看第三个文档啊,上硅谷大数据技术是oop啊,其中的map reduce,还记得map reduce是实现什么功能吗?是海量数据的计算问题。对吧,哎,那我们来看一下卖六,我们要学习哪些内容啊,我们还是看一个这个。新建发布。360。OK,在map当中我们要学习这么几项内容哈。还是从是什么怎么玩啊开始。那第一个呢,就是hadoop的。WEB60的一个概述啊,WEB60概述对吧?哎,研究一下它是什么,它是解决什么问题的,那第二项。用这个符号吧。OK,一二,第二个呢,我们解决的是嗨动的一个序列化问题,序列化据说咱们在学这个。
01:00
Java基础的时候是不是也学过这个序列化呀,对吧?Liable,那这里面看看有什么区别,那第三项我们要学的内容呢,就是map核心的一个框架原理,核心框架原理非常重要啊,非常重要,那这里面包含哪些内容呢?给大家说一下啊,从这么几块去着手,首先对它输入的数据怎么处理,输入数据处理,那我们这里面用到的是input for媒input much。那第二块呢,就是对它输入进来的这个输入端接收完数据之后,那对它进行一个后续的一个逻辑变换,对吧?哎,其实一个洗牌的过程叫suffer suffer。那再往后后边呢,就是对它输出数据的一个处理输出数据,那输出数据呢,这里面我们用到的是out put的什么。
02:03
Out,慢行,那后面还会用到一个对应的噪音计算。OK,数据招引,然后再来。还有对应的这个ETL清洗,诶怎么清洗呢?有一个相关案例,那最后呢,是对整个开发的一个总结,比如说你站在这个开发的角度,你去如何来学习对应的这个组件啊OK,接下呢,我们看一下这个第四块,第四块呢就是high度的一个压缩,压缩,压缩里面我们重点掌握的内容呢,包括这么几项,比如说有哪些压缩算法。啊,各自压缩算法的一个特点,对吧,还有在生产环境下我们怎么用,哎,这是我们要解决问题,那行,那迈六概述当中啊,哎,解决的问题呢,是这么几个小点。
03:14
首先呢是定义对吧,哎,它是什么,它解决的什么问题,它的优势劣势分别都是什么。再来还有呢,这里面哎,最主要的给大家提供了一个word count的案例吧,那现在呢,这个word count案例啊,不知道大家有没有感觉,就跟我们学Java的时候啊,这个hello word是一样的啊,学习这门任何一门语言都有自己的一个hello word,那hello里面呢,其实hello word呢,就是这个word count,包括我们后面学这个Spark flink的时候用到的这个也是word count啊,都是从word count开始啊。行,那基本上呢,我们学习这么四项内容,那当然还有最后一块呢,就是如果说你在学习过程当中遇到问题怎么办,对吧?诶给你提供了常见的问题及解决方案。
04:12
哎,这么几大块啊,来学习啊,先从整体上有一个印象,后面呢,我们会细节啊,一点点给大家去详细的剖析。
我来说两句