00:00
各位同学大家好,我是上硅谷Java意义学科讲师孟庆祥,接下来呢,我给大家分享一道面试题,面试题的题目是也来测试和solo的区别。那么要想了解这两者的区别呢?我们先来聊一聊以来色和sola的背景啊,Solo的背景,那么来色和sola它们都是啊,这个他写错了啊。他们。都是基于谁呢?基于lon的搜索服务器啊。都是在lon的搜索服务器基础之上开发的一款什么呢?优秀的,高性能的。企业级搜索服务器啊,有这一句话就够了,那么在这里要强调的一个重点是,他们是属于这种高性能的企业级搜索服务器,那么有没有同学在想,为什么它是高性能呢?那么高性能怎么才能。
01:13
得出来的高性能呢,是为什么它会高性能是。在这括号里边给大家做个解释,是因为。它们都是基于分词技术啊,都是基于分词技术构建的什么呢?倒排啊,倒排索引的方式进行查询的,所以他们。是属于这种高性能的企业级搜索引擎,搜索引擎,那么在这里又出现一个新的技术词啊,新的技术名词叫做什么?倒排索引。那么在这儿呢,我就不对这个道牌索引做过多的解释,那么如果要想更加清楚的了解依赖色式,大家请去我们硅谷的官网啊,硅谷的官网去下载相应的视频,那么在这呢?
02:06
我们就先把依赖测试和solo的背景介绍到这。那接下来呢,我们再聊一聊来测试和solo的他们的这种开发语言啊,开发语言都是基于什么呢?Java语言开发的啊,Java语言开发。那么再来聊第二个问题,以来和sor它们的诞生时间啊,诞生。时间。以来色和sola相比,Sola要早于以来色啊,Sola的诞生时间是2004年啊,2004年诞生的,那么ES啊,我在这里就简写了啊,将E简写为ES以后大家在面试过程中,如果有面试官提到ES,那么你要明白它代表的是以来测试啊,那么ES它是诞生于2010年啊,2010年诞生。
03:08
相对于sor来说会晚一些。那么所以ES什么。比较。啊更新一些啊,更新更新啊更新一些,所以相对来说呢,功能啊,功能可能就呃,功能怎么样,就越强大吧。啊,越强大,那么在这呢,有了背景知识和我们的开发语言和诞生时间,那么在这呢,我们重点来聊一聊他们的两个区别。第一点,那么来和这个solo第一个大区别,那就是当实时建立索引的时候啊,将实时去建立索引的时候,这个solar呢会产生会产生IO阻塞啊,而谁呢,以来色则不会,所以。
04:17
ES啊,所以ES的查询性能要高于我们的,所这是第一大点,那么第二大点呢,就是在不断啊动态添加数据的时候。收了啊收了的检索。效率会变得低下啊,会变得低下,而这个。啊,Ses则不则没有什么变化啊,没有什么变化,所以从这两点看啊,从这两点来看来说。
05:00
以来测试的性能都要高于谁呢?Sola啊,那么换句话来说,之所以有了sola sola在这当实时去建立索引的时候和动态添加数据的时候,它的性能不好,所以才有了谁啊,才有了ES的产生啊,才有了ES的产生,那么第三点再来sola啊,Sola是利用谁呢?主keepper。进行。分布式管理,而我们的ES啊,就是EAS自身,它带有什么呢?分布式系统管理功能啊,依赖测试,它自身带有分布式管理学,而sor呢,它必须要接入谁呢?主K进行管理啊,主K进行管理,那么后续这块呢,我还会由。给大家准备了两张图啊,详细的给大家介绍solo和ES怎么solo,为什么要要介入主cable,而ES为什么?
06:09
自身带有这个分布式系统管理功能,那么还有这个solar。一般部一般它都要部署到哪呢?部署到web服务器上才能使用啊,外部服务器上才用,比如谁呢?汤姆凯特啊汤姆凯特是吧,那个汤姆猫,而启动汤姆凯特的时候,启动汤姆凯特的时候呢。需要呢配置。需要配置这个汤姆凯特与sola的关联,那么在这儿不得不说啊,另外一个知识啊,不得不说另外一个知识,在这呢,大家也要记住搜了的本质啊,Solo的本质是一个。
07:06
动态的外部项,所以我们要想用solo的时候必须把so了。放在哪呢?服务器上,也就是说我们的汤姆凯特或者是其他的服务器啊,所以这一句话大家要记住了,Solo的本质实际是一个动态外部项目啊,也是动态一个外部工程。知道这个,那么再来第四个啊,Sor,那知识呢,更多的。格式数据啊,更多的格式数据。比如说。XL,还有这个杰森,还有CSV啊,CSV等而。而谁呢?ES以来仅啊,大家记住,仅支持什么呢?杰森文件格式啊,是支持杰森文件格式,这是它们的最大区别,你要想在ES里边。
08:10
存放叉XML这种数据,那我告诉你不可能啊,不可能,这是第四点第五点。搜了是什么呢?传统搜索。啊,传统搜索应用的有利解决方案啊。但是ESES更适用于新兴的。实时搜索应用。这句话什么意思,就是啊,我在这同样吧,我在这加上一个。单纯啊,在这单纯的对已有。
09:01
数据进行检索。进行。检索的时候搜了干嘛呀,收了效率。更好啊,更好,换句话来说,它要高于谁呢?ES,但是对于这种动态数据添加,以及当实时去接力索引的时候,谁呀ES要高于sor啊?所以说现在啊,大部分我们的应用企业来说,你会发现ES的使用频率会逐渐上升,而solo呢会逐渐下降,因为我们数据是不断的在发生变化,所以ES使用率越来越高啊来再调一下第六点啊,第六点。搜了搜了官网提供的功能,对更多啊,提供了很多很多功能,而我们的ess本身,它更注重。
10:11
与谁呢?核心功能也就是检索啊,核心核心功能一些高级功能啊,一些高级功能什么得需要多有什么呢?第三方。插件啊,提供,所以这个就是咱们的以来search跟sor的一个重要区别,那么刚才我说了,我说要带大家看一看。Sor为什么会要利用组keepper进行分布式管理啊?下面来我们同学往下看,老师在这呢给大家准备了一组图啊,一组图,那么第一个啊,看下这张图,这是上边呢,这是组keeper集群,而这个呢就是solo的集群,那么so了集群之后呢,我们叫做sor cloud。
11:03
做K齐群咱们不用说了,咱们看看看,咱们来看一看这solo齐群是。怎么做的,那么sola刚才在上边我已经给大家说了,Sola它本身来说,它的实质就是一个。动态外部项目,所以我要把它搜了,放到哪呢?放到我们的tomcad里边,而下边这个192.168.26.106080就代表了一个他们开的服务器,而这个7080也代表了一个服务器。所以我在这里将。所有的solar项目都放在tomcat里边,而tomcat它又由谁来去管理呢?又由我们的主keepper去管理,那最终发现出来的效果,这个图片最终发现出来的效果是什么样的?是看这就是,这就是sor的集群啊,我们叫solar cloud。啊sor cloud集群,那么在这呢,老师给这图稍微放大一点啊,大家可以看一下,那么solar呢,集群之后呢,就是这个样子,看这由一个索引库分出两个。
12:12
分片啊,分片下边分别画的两个节点,一个是这块,可以清楚的看到6080 8080 7080呢和9080它们是一组,所以这个就是solo的集,Solo的集群,而ES的集群来看一下就很简单了,本身S的集群呢就非常简单,刚才说ES带有自带的分布式管理系统,这个就是我们的ES。以来射出的一个积雪,所以综上所述啊,无论是从这个。优缺点来说,还是从这个集群的复杂性来说,那么以来设是要优于谁呢?Solo,这也就是为什么现在以来色它的使用率要。
13:01
高于solo的一个重要原因啊,那么这个面试题呢,我就讲解在这儿,感谢大家收听。
我来说两句