- 00:00 - 好,那我们从今天开始学习这个fruit啊,学习那还是同样的道理啊,就是之前我们提到一个点,呃,在大数据当中呢,我们主要的解决的是三件事情,对吧,每一个框架呢,都是他自己的定位,那我们看一下这个from的定位,之前我们聊的三件事情是哪三件事情。海量数据的传输存储和计算,对吧,计算那这个呢,它是传输的。传说的之前我们讲了存储和计算对吧,那那个数据怎么从Java后台服务器到我们的这个大数据集群的,因为在生产环境当中,大数据集群跟加后台整个集群不是一套。啊,服务器不是不是一台啊,通过网络传输把这个数据给他传过来的啊,不是在同一台上面能听懂啊,嗯,因为你加入后台啊,它处理的复杂的一个业务逻辑,而本身大数据这边呢,处理的数据量比较大,他也需要很高的一个资源,所以你不可能说把两个业务部署在同一台服务器,没有公司这样的,就算是小公司,他大数据集群整个的可能什么,呃几台,三五台或者十几台等等这种他绝对不可能把这个大数据集群放在那个后台服务器一块。 
- 01:16 - 啊,他会把后台整个的拖垮,因为后台是跟页面交互的,你大数据集群,假如说你一个任务跑不起来,你今天跑不起来,我可以明天跑吧,但是你想想看,你整个后台呢,电商网站你访问的好好的,崩了一下。对吧,然后好不容易好了,等了好几分钟,然后好了,对吧,然后又崩了。这还有用户吗?还会有用户吗?对吧,就不可能有用户了,其实像那个京东的集群还是经常挂的,我不知道你有没有关注到,就是有时候经常下课之后。京东的整个页面会样式全部丢失了,就是因为它那个后台有的服务器崩了,就样式全部丢失了,就什么意思啊,你们看到不有很多那个文档吗?很多文档不就是前面什么蓝字啊,下面一个下划线调这种的,对吧?啊京东整个页面呢,就变成那个样子。 
- 02:05 - 啊,全部变成那个样子,就是样式全部丢失了啊,因为他的服务器了,而且去那个学生说他们那个。整个的大数据就是你们看到的公公用户使用的这个页面还好啊,就是方的次数会少一点,内部的服务器经常宕机。内部服务器经常宕机啊,就是很正常的,所以说你不可能把大数据集群呢,放在一块儿啊,放在一块要呃远程给他传输过来,那这个时候呢,肯定会用到我们这个。工具啊,不一定是啊,市面上这个传输工具呢也很多,但是呢,用的是最广的啊,应用面最广的,所以说我们着重的是讲了一个内容,但是市面上呃,除了服务之外,他还有很多都可以做这个事儿。啊,都说这事啊,也就是说从另外一台机器的把它这个文件给他读过来,因为我们知道正常的后台服务器,后台服务器上跑的业务是不是也是一个工程啊。 
- 03:00 - 对吧,也是一个项目,那这个项目产生的数据日志一部分呢,就是业务数据,你的订单啊,还有支付啊,它是不是落到MY里边。还有的,你的访问日志呢?对吧,他宋老师他喜欢海狗人参丸,他鼠标在上面悬停。悬停有的也会记录什么日志,看你悬停了多长时间,悬停多长时间,还有你搜索的关键字呢,对吧,那宋老师经常就搜索一下韩国人生版对吧?啊,那搜索的关键字他都要保留的啊,他都保留的诶那这种呢,是我们所说的这种用户的一个行为日志。啊,芯片日志,那这个呢是日志,它会落到磁盘的。他不会写到MYSQL数据库里边。啊,不会写到MYSL数据库里边去做什么分析啊,这些东西它会写到日志里的,那也就是说这是一个文件对吧,形成一个文件,那如果说这个东西,呃,它的后台服务器跟我们大数据集群在同一台机器上面,是不是这个事情就好搞定了。 
- 04:00 - 我们可以定时的,诶你不是落落盘,肯定落在某一个文件夹里面了。对吧,你不可能说今天录这个文件夹,明天录那个文件夹吧,啊,他可能像我们have那个日志一样,诶每天呢,滚动一遍还还一样吧,Have日志是不是今天叫have.log到了明天,今天的日志就加了一个什么后缀日期,对吧?哎,就是生产环境当中日志也是这样的,因为help它也是一个什么。人家写的工程,人家写了一个项目,那你后台整个也一样的,也就是说生产环境当中,这个数据呢,是放在后台服务器的日志里边,那我们要想办法给他采集过来啊,就会用到我们这个啊,来做这个数据的一个采集啊,数据一个采集,OK,那我们是从呃,大数据所解决的问题上面。来考虑了一下,这个到底处在哪一块啊,处在哪一块,那接下来我们整体看一下这个我们要学什么东西,对吧。就这四章内容,四张内容在生产环件当中绝对够用了啊,绝对够用,但是每章内容不少啊,看着好像就四张。 
- 05:01 - 第一个呃,概述这一块呢,就是我们了解一下整个的一个定义啊,干什么活的,因为我们只是粗略的说了一个,它是传输的,对吧,它到底呃有什么好处,应该传输哪些东西,对吧?啊,能传日志,还能传视频,还是那个图片等等这些东西能不能传呢?对吧?啊我们要了解一下之后,更重要的应该是他的一个关于架构这块东西。也就from它能做到传输数据,它是中间有哪些组件我们要去了解一下啊,有哪些组件我们要去了解一下,因为会影响到我们写代码呀,对吧?好,那之后呢,是这个入门,入门这一块呢,就是我们要安装部署一下。安装部署一下之后呢,有四个案例啊,有四个案例逐层递进的,就是你会发现这四个案例啊,呃,其实在生产环境当中,我们更多的就用最后一个。最后一个,但是你不可能说直接上来就是这个啊,因为他就是不好理解一点,我们逐层递进的啊,逐层递进的生产环境当中呢,更多的这个内容,那之后呢,进阶这块呢,就是它里边的一些啊,其他的一些整个的原理啊。 
- 06:08 - 等等一些东西,更深入的一些东西了啊,更深入的一些东西了,就是慢慢的递进的,那最后一张就是企业当中的一个面试题啊,面试题到时候大家串一下啊,大家大家串一下,主要的呢,就是前面三章内容啊,每一章呢都是重点。每一章都是重点啊,你要说稍微次要一点的话,呃,第一章应该稍微次要一点,23章是绝对都是重点啊,一定要掌握的OK吧啊,这是我们对于这个这个课程整体的一个介绍。 
我来说两句