00:00
那么接下来再往下啊,再往下,再往下呢,这里是不是咱们一开始说elect search,它本身是基于lon实现的呀,这个lon什么东西啊,那么这个呢,咱们给大家介绍对吧?那现在呢,我要把咱们luns是什么给大家介绍一下对吧?那么这里呢,如果你要是看一些我们这个elector的相关资料的话呢,那么这里可能啊,会看到这么几个概念,Losss,然后呢,这个nature啊,以及呢,我们这个elect search对吧?那么我现在呢,他们几个到底什么关系是吧?到底什么关系对吧?那么其实这里呢,有一段发展史对吧?像这个东西大家听一下就OK对吧?首先在咱们这个酒吧的时候是吧?这个谷歌啊,这个Google对吧?他呢在咱们这个美国成立了,然后接下来那么他是干什么的呢?它其实呢,是一家做我们这个搜索引擎的这家公司对吧,美国家其实都有做咱搜索引擎的公司,比如说你看咱们这中国百度对吧,美国谷歌,俄罗斯的亚大夫对吧,咱们后来呢,在咱们这里克林浩斯其实就是。
01:00
是我们这个俄罗斯做索有引擎的公司,对吧,出的对吧,然后接下来呢,那么咱们现在在这里边,就在那个时期啊,有一个叫做do cutting的一个工程师,对吧,他也迷上搜索引擎,这个人大家熟吗。Hey。你不是道哥?这个人你们没见过?没印象,一点印象没有。那我先问你们,这个利作者是谁呀?李纳斯是吧?除了之外还有别的什么最厉害的贡献吗?对吧,这个后面咱讲getate对吧,然后你们大数据学的第一门课是谁,是什么?哈杜是吧?哈杜作者是谁。啊,这个没接触过吗?这个应该在这里,应该在咱们想哈豆的时候,应该告诉你们一声,说有一个叫talk卡,那个这个哥们是吧,对吧,应该应该到我这,你们的反应应该是一说到卡哦他呀,因为这才对呢,是不是对吧?注意啊,这个就是我们这个哈杜op的作者啊哈杜的作者对吧?那你们应该知道咱们的哈杜当时在咱们这写的时候,应该受谷歌的三篇论文影响比较大,这应该知道吧,对吧?诶那么这块注意啊,就是说咱们现在谷歌对吧,一开始呢,他是做我们这个搜索引擎的对吧?然后呢,有一个我们这个叫道卡汀的工程师对吧,其实这个这个哥们是谁?就是我们这个函度的作者对吧,他也迷上搜索引擎对吧,所以说呢,他基于我们的扎言啊开发了一个用于我们的文本搜索函数库,注意啊,这个东西它不是一个网站。
02:52
像谷歌百度他的网站做搜索引擎的,但是后来呢,他发现,哎,我这里边我的项目也用到它,对吧,我觉得搜索引擎呢,肯定在我项目里边有用到的地方,对吧,所以说呢,我写了一个我们的组件,你可以把它理解成一个价包,这个价包呢,可以理解成对,可以完成我们在我项目里边,然后呢,它的一个全文检索。
03:11
啊,就是你想在你的项目里边又全文检索,你把咱的价包拿过来对吧,就OK了啊,就可以用对吧?然后接下来啊,那么咱们现在呢,在咱们这里,当初他在写咱的组件的时候呢,给它组件取了个名字,这个叫什么呢?叫lon,这个lons是搜索引擎吗?其实不算啊,这个lon它其实只是一个我们的函数库,其实只是一个我们的JA包,Java语言完这些功能,对吧,可以实现咱们当前的在我项目里边它的一文本搜索这样的一个功能,对吧?那么我们现在呢,注意loss本身当时呢,在去写的时候呢,它其实也比较强大,对吧,你看提供了一些我们的接口对吧,然后呢,完成了我们现在在我这个项目中的一个信息检索对吧?信息检索对吧,然后接下来,那么咱们呢。这个lus呀,那本身因为它也是扎va原写的嘛,对吧,而且扎va园呢,从咱们这个这个这这个这个对吧,这个创建之初到到咱现在是不是一直发展势头是比较火呀,对吧,所以说呢,那么咱们扎入项目发展越多,或者说这这个扎项目到越多,咱们像Lu呢,它的应用呢,对吧,也越来越广泛,也比较受欢迎对吧,也比较越受欢迎,对吧,然后后来呢,接下来在过一段时间之后,对吧,然后呢,这哥们儿在我lun的基础之上呢,对吧,那么又做了一些我们这个完善,然后出了一个什么呀,出了一个我们个notch对吧,那么它呢是我们这个到cutting在哪呢?在咱们luns的吧,它的上面的一个基础上做了一个我们的优化啊做优化,那么它呢,是一个真正的一个程序了,对吧,它一个真正程序了,对吧,那我现在呢,如果说啊,你要是想去用的话,对吧,原来呢,你可以去使用我们这个lun,但是lun如果要是往你的项目里边引入的话呢,这个东西使用起来比较麻烦,所以说呢,这哥们对。
04:58
对我的nu做了一个优化,对吧,就是咱们的not对吧,然后接下来那么咱们如果说你在项目里面想用我们的搜索功能的话,你直接把这not呀拿过来就行啊,把这note拿来就行,那你可以看到是吧,说有了note之后呢,那么它的目的干什么?就是减少我们在使用过程中的复杂度,就它比咱们这个使用los直接使用los要简单。
05:21
对吧,然后你这样的话呢,你在咱们这个站内就可以实现类似于我们这谷歌或者百度对吧,一样的一个搜索功能,对吧,这个东西需要咱们自己写吗?不需要同学们。对吧,不需要对,记得很多年之前我看过一段,这个是这个东西对吧,有一本书对吧,有一本书对吧,专门是lessons和咱们对吧,哎,那么这个呢,如果你要想在项目里面用的话,直接把它给它引用进来就行了,对吧,那么al elect是什么呢?Al elect这样对吧,那么它本身呢,对吧,在这里他说呢,做什么全文检索的对吧,简称ES对吧,然后呢,本身扩展性能很好,然后呢在这里对吧,可以什么扩展多少服务器,处理多大数据对吧,那么这块呢,大家注意主要看它和我们这个lun的关系,对吧,那么al来ER,它本身呢,也是我们这个Java开发,并且呢,使用lun作为我们这个核心对吧来进行实现的,对吧,但是注意啊,它的作者不是我们这个dog cutting了,就咱们这个dog cutting对吧?那么他都写的什么呢?一个是我们现在的lessons对吧,这是他写的,一个呢,是我们对吧?还有一个什么呀,他杜op对吧?这是这哥们做的对吧?但是Alexa是呢,他不是对吧?那么Alexa是谁呢?对吧,下边这哥们。
06:34
这发量还行对吧,那么咱现在呢,这哥们的,哎,他呢写的我们这个短这个elect search,那么这个elect search呢,注意那么它呢,其实对吧,也是使用我们这个lon,也是基于我们这lon作为它的核心,对吧,来实现网线搜索呀,或者索引呢这样的一个功能,对吧?那么具体呢,它的一个我们这个排名大家也可以看一看,对吧,在咱们这里啊,对吧,有一个electric search对吧,它的排名其实呢和我们这个sor它呢是一个竞品啊,但目前呢,这个solar其实排名是比较稍微靠后的,对吧,来search它的发展呢,其实是比较这个势头其实比较好的,对吧,那么这里呢,对吧,这个有一个什么呀,有一个关于我们这个来S它的一个起源啊,对吧,或者说它的一个我创建的一个故事,我说最早的时候呀,那么这个在写来的时候呢,对吧,他其实主要是想干什么呀,他主要就是帮他老婆对吧,写一个搜索菜单的这样的一个功能,那时候他老婆是在饭店工作。
07:34
对吧,然后后来呢,对吧,他想写一个应用程序对吧,就帮助他老婆在咱们这个当前这应用程序里边来搜索咱们这个菜谱,对吧,来搜索下菜谱对吧,然后他基于我们Lu对吧,写了一个我这个程序对吧,然后后来呢,在工作里边发现,诶这个东西还挺好用,对吧,然后呢,在他的程序上面做了一个包装,然后发布了第一个产品叫什么呀,当时叫指南针啊,当时叫指南针,然后后来呢,这个东西对吧,发展越来越好对吧,然后接下来对吧,他把它独立出来了,然后呢,作为我们这个Alex search啊,这个大概的一个发展过程都要应该知道,把这些讲完之后呢,那咱们现在注意啊,同学们,像这块东西大家晚上千万不要去再回去看视频了,其实对吧,就是你如果说要花满了,花一年多的时间再去看这个视频对吧,那其实一点意义也没有对吧,一点意义也没有对吧,大家知道一下,那么重点是什么呢?就是我叨叨叨叨叨对吧,这个一节多课的时间,第一个你知道对吧,我现在学的是来search,它是一个对吧搜索引擎对吧,但是呢。
08:34
你把它作为一个我的数据库,那也没问题,对吧?那么第二个,那么咱们现在呢,这个elect search和Lu,然后呢,Nuch它们之间的关系是什么?最早的时候是不是到cutting写了一个我们现在库叫Lu呀,然后呢,对着库做一个完善,是不是咱们not呀,对吧?然后接下来另外一个哥们基于我nu,然后呢,开发的我们的elect search对吧?然后elect search呢,那么它的底层在做全文检索的时候,它的一个架构是什么样的?其实主要是倒排索引对吧?倒排索引的结构是什么样的,和咱们传统的我们这种数据库存放数据的方式啊有什么不同,传统数据库如果要存放数据的话,它是不是应该是我们当前的标记,然后是咱们的数据呀,对吧?那么如果倒白索引的话,它会把咱们数据进行一个分词,对吧,是以我们这个单词,然后记录的形式,对吧,来进行一个存储对吧?这是关于我们现在呢这个倒白索引,然后A有什么特点呢?第一个天然集群,第二个天然分区,第三个天然索引,对吧?把这些对吧完事之后,咱们就可以往下走了,对吧。
我来说两句
6
666