温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,接下来我们来看一下hidoop的优势。那这里面我们从四个方面来展开说,Hiop这个框架,它到底有哪些强大之处,那第一个方面呢,就是hi多op的高可靠性。那还多个底层呢,它维护了多个数据副本,那什么叫副本啊,大家看一下啊,这102103104呢,是三台服务器。那在三台服务器上存储这这样的数据,绿色的表示它们是一模一样的内容,完全的一个拷贝。对吧,那么假如说突然间有一天这块硬盘。坏了,比如说这里面的数据都丢了。那会不会对整个集群进行影响呢?不会,因为这里面还有对应的备份,所以说这是还多的高可靠性的一个特点。那再来还有一个叫高扩展性。那这个又怎么理解呢?看一下假如说啊,正常这个工作当中机群有三台。
01:00
但是大家都知道国内有一个特色呢,就是双11和618大家这个疯狂购物节,对吧。那么这个时候啊,数据量会很大,如果你正常情况下三台服务器呢,是不能保证进行正常工作的,那我就想我能不能增加两台服务器。但是你想啊,以以往的经历来说,你增加两台服务器,那是不是我要停止一下当前运行的集群,然后把它们都配置好了再一起启动呢?那这样效率高吗?肯定不高啊,你要把正常运行的集群给停掉,然后再配置再执行。那黄瓜菜都凉了对不对,哎,这也不行,那怎么办?那能不能说这三台机器正常在运行的时候,我动态的增加两台服务器呢?还就能够做到这一点,所以说它具有非常强大的高扩展性,动态增加,动态删除,比如说双11要来的时候,我们动态增加机器,双11过立即把机器撤掉啊,后面呢,我们会有专门的案例来给大家演示啊。
02:00
这是这一块,那下面来看第三个方面,就是高效性。来看啊,呃,在MAP6思想下,MAP6是啥你还不知道啊,先别管,说还多呢,是并行工作的,以加快任务的一个处理速度,比如说它是并行工作,很重要啊。那原来我们是单台服务器的时候,比如说海底101,那就放一个任务正常执行呗。那想,那如果我有三台服务器。每台服务器负责完成这个任务当中的一部分。那三个人干活总比一个人干活效率高吧,哎,所以说这还度吧,并行计算。再来。高容错性啊,最后一个特点,高容错性。能够自动的将失败的任务重新的分配。比如说这是三台服务器,这里面运行的任务,其中计算任务,计算任务,然后呢,这两个计算完之后,再来一个计算汇总任务。
03:00
但是有天有不测风云的,有可能这个任务在运行过程当中突然间发生了意外,咔一把飞刀过来把这任务干死。那干死了,那你整个这些任务就都白刷了吗?那效率有点太低了。那嗨多在底层自动将这个任务迁移到某一个服务器的。上啊,那当然这台服务器呢,一定是具有相关的资源。那假如说这里面把103的任务直接迁移到幺零市场进行计算。不影响任务的这个计算最终的计算结果。这就是high度的优势啊,非常强大啊,这么是高高可靠,高扩展,高效性,还有一个呢,就是高容错性,了解一下就可以了,后面呢,我们会针对各个特性呢,进行更深入的一个讲解。
我来说两句