00:00
那么再往下走呢,那么这些操作呀,我希望大家呢,要稍微熟练一点啊,我希望要稍微熟练一点,就是什么呢?关于我们这查询啊,因为我们说这个东西本身呢,它是用来做我们这个全文检索的,对吧,所以说你要写的话,你肯定把这个查查询呢,要玩的稍微溜一点啊,要玩稍微溜一点,那么具体咱们现在呢,这个查询对吧?那么怎么来用对吧,都有哪些对吧?那么咱们现在呢,一起来看一下,对,一起来看一下,呃,首先呢,那么如果要查询的话呢,那目前啊,咱们掌握的对吧,那我在这里。这个是我们这个查询操作的对吧,那目前啊,咱们现在掌握的查询对吧,那应该是get,然后接下来我现在呢,有一个什么more in that对吧?那么咱们这么一查询啊,它可以把它当前的这个文档结构给我查出来,然后接下来那么咱还有什么呢?是不是还得学一个search呀,这个search是干什么?
01:03
是不是可以查询出咱们当前这个索引的所有数据啊,对吧?在这里啊,在查询的时候,那我现在呢,要查询出咱们这个当前我们这个索引中,呃,索引中它的全部数据,对吧?那么其实正常情况下,我在查询的时候呀,那我有可能我会加一些参数,比如说呢,你把ad为多少多少的给我查出来对吧?把名字为谁谁谁的给我查出来,对吧?那么如果加参数的话呢,有两种形式啊,就是我现在查询的时候加参数有两种形式,那么第一种形式呢,那么是咱们这种形式啊,比如说我现在呢,在这里我想查询啊加参数对吧?你可以把我们现在ID等于我66的对吧,那这个东西给我查出来,那么参数怎么加呢?一个Q参数名称,然后具体这个呢,是我们现在具体参数的内容,对吧,那么具体还可以怎么写对吧,这会儿呢,大家感兴趣的话,可以到咱们官网上来看一看,但是这种方式呢,一般的。
02:03
他不用对吧,这种方式了解对吧?哎,那我如果要想查询的话,一般参数咱们怎么来给他指定呢?咱们一般呢通这种形式对吧?将我们现在的参数是吧,也以我们的阶层的形式呢,来放到我们的请求题中啊,放到请求题里边,那比如说啊同学们,我现在要以阶层形式来放到启体里面去的话,我想查询全部,那么这个东西怎么来查询呢?来get,然后我现在呢是末尾index,我要想对它来做查询对吧?那么如果做查询的话,那么这块呢,那么你得给我加一个东西什么呢?加一个下限search表示做查询对吧,但是我在查询的时候啊,在这里对吧,我在做查询的时候,那么这里呢,我得加一些参数,这个参数怎么来指定,有一个叫query这样的一个属性,对吧,那么到底查什么呢?对,其中有一个叫match匹配,那么如果说我要MATCH2的话,注意你查询的结果和咱们现在这个东西直接执行它是一样的。
03:03
也就是说啊,咱们现在夏天测试查询全部,其实呢,他帮你把这个东西给省给省略了啊,就是把当前的匹配的全部的内容都给它查询出来啊,都给查询出来,但是我们实际的时候,我那我可能我不查全部呀,对我可能呢,需要加一些条件,那么如果加条件的话,那么咱们现在这个东西对吧,那么应该怎么去加啊,都可以怎么去加条件来,那么咱现在呢,第一个啊,在这里咱们来看一看,说首先呢,我要按分词查询。啊,我要想按分次查询的,比如说我现在呢,在咱们这里边,我把数据给恢复一下,同学们,呃,来到这里,我把咱们现在的这个数据给它干掉。Delete more index,那目前没了,然后呢,往咱们现在呢,这里边放三条数据啊,放三条数据,然后接下来,那么咱们现在呢,去查询一下来,注意看来在这啊,我现在在这去查询一下,上面有直接呢去查询我们当前的这个记录到当前index里边的数据一共有三个,那么当前这三个分别是哪三个电影呢?一个是我们现在它的一个红海行动,对吧,这个是咱们的IDV1的注意啊,在这里CTRLC对吧,这个index里面第一个是我们的户外行动,那么除了户外行动之外呢,那么再往下还有对咱们这个。
04:31
湄共河行动,对这个呢,是我们现在第二部电影啊,然后第三个呢,还有一个是我们这个红海事件啊,红海事件对吧,那目前啊,咱们现在move index里边有这么三个记录对吧?在这里move index里边对吧?那么目前呢,有这么三个我们的DOCUMENT3个文档,这没问题,能理解吗?同学们对吧?然后接下来呢,那我现在呢,要查询根据什么查询呢?我想根据电影的名称来进行查询。
05:03
啊,我想用电影名称去查询,那么如果跟电影名称查询的话,那么咱们现在这里怎么来查询呢?来在这里啊在这里对吧,我呢要查询来get,然后呢要查询莫nice,然后接下来做我们这个search对吧,但是我现在查询呢,我要根据啊,我呢要根据我们这个电影的名称啊,根据我们的电影它的一个名称来进行我们这个查询啊给点名称来进行查询,那你是不是得加查询条件呀,那么这查询怎么来加呢?Query,然后接下来咱们刚才是不是有个麦照啊对吧,那你想一想现在还能麦照吗?对吧,你是不是得和电名称匹配的呀,你不能一下子圈给我对吧?所以说这个呢,就得自己写match了,对吧,刚才注意啊,咱们这个match on对吧?那么默认情况下,其实呢,就是match,这表示查询全部啊,表示的是我们这个查询全部啊,查询全部,但是呢,那么咱们。
06:04
我现在想干什么,想根据某一个字段查询,注意啊,同学们,我在写宽运之后,我写完match之后,注意啊,啊我一点回车,那么这个时候它自动的帮你把咱们这个内容是不是已经对吧给你生成出来了呀,对吧,你只要按照它的提示是不是细胞里补充内容就行了呀,对吧?那么你现在这个field表示什么,表示的是你现在是不是按照哪个字段查询啊,那咱们应该写谁name对吧,也就说我现在呢,哎要按咱们name部来查询,然后接下来,那比如说这个test,这个test是什么。是不是相当于你在咱们这个文本框里边输入的内容啊,就相当于你在咱们这里边打开了我们这个百度啊,相当于你在打开百度,然后你在百度这里面有个框,然后呢,你这里要输什么东西,然后接下来咱一点查询,是不是要你输入东西,然后和电影名称进行匹配啊,对吧?哎,那么咱们现在呢,在这里,那你说什么呢?比如说我要说啊,咱们这个红海行动注意啊,咱们这里是不是有一个电影叫海行动啊,那接下来我现在呢,要把咱们电影名称为红海行动的给查出来。
07:10
注意看同学们,当我执行的话,那么大家觉得那么应该啊,查出几条记录出来。Yes。我现在这里是一共有三条数据,同学们一共是不是有三条数据,或者三个document在w index里面,然后接下来,那我现在呢,如果说我现在要想去查询我们现在的红海行动的话,那么大家觉得这个返回结果应该有几条数据条?三条你们觉得呢?有红海行动,有红海事件,有湄公河的这个行动。咱们现在,然后呢,我现在要根据它来进行查询啊,在这里这个呢是我们的查询啊,这个是我们一个数据吧,这个呢,我现在有三条数据啊,或者三个啊,有以下三个咱们document啊,然后接下来document。
08:16
然后接下来,那么咱们现在呢,在咱们这里边啊,在咱们这里边儿对吧,然后呢,我现在查询条件啊,查询的内容是谁呢?是我们这个operation c,对也是我现在在咱们这个索引里边啊,这个表里面有这么三条数据,然后呢,我现在要从咱们这表里边把operation c给查出来,你们说几条三条。不是一条吗?哎,注意啊,同学们,首先第一个如果是一条的同学,那你现在呢,理解还稍微差一点,咱们现在三条是对的,为什么是三条?因为咱们要分词呀,对吧,你想一想,我们现在这个东西,它底下存的时候,是不是倒白索引的方式存的呀,对吧?倒白索引的方式存,那么咱们这里在存的时候肯定要分词,不光存的时候分词,你查的时候是不是也要分词呀,对吧?所以说我们现在这三张数据里边,大家想一想,你查咱们这个行动,你是不是可以把这些东西给我查出来,你查咱们现在这么红海这东西是不是也可以查出来,所以说呢,那我现在呢,应该是三条数据,这个没问题吧,同学们对吧?然后接下来当前咱们这三项数据呢,再往里插的时候,Ad为一的是谁?Ad为一的是不是后海行动来在这里ad为一,然后接下来ad为二的是谁呢?是我们这个灵活行动的ADV3那样,那么咱们是红外事践,那么大家现在给你们时间,你们不管是什么方式,拿笔画了也或者拿图画了也好,然后你们觉得这三条记录谁应该排在第一位,谁排在第二位,谁排第三位。
09:54
132是这样的顺序吗?
10:06
这么出乎的意料,我还想让你们算一算呢,是不是你太不配合了,你们应该,哎呀应该假装算一算就告诉我才对呢,是不是132是对然然后还应该假装说错的是不是,然后我才能往下讲,是不是有以上几分钟疑问都说对了,是不是啊,那注意啊,同学们,那么咱们现在呢,这里大家应该把这些东西啊,怎么算的,应该对吧,这个知道咱们先来看啊,这个结果对吧?是不是132啊,是不是132,我现在是不是根据我们这个红海行动啊,这个红外,这个红外行动去查询我们当前这个索引啊来运行,注意看同学们,咱们现在呢,执行完之后返回三条结果,这没问题,然后第一个你看一共三条,这第一个咱们刚才已经确定了三条,然后第二个呢,咱们排在第一的是谁呢?是不是我是一,然后呢,第二个是三,第三个是二,那为什么这样结果所有人是吧,就如果说啊,这会没反应过来的,跟着我仔细听对吧,那么咱们现在啊,我们整个这个index里边,它的数据是这样的,但是呢。
11:07
啊,它就是在存的时候,它并不是这么存的,它是怎么存的呢?它应该是operation,那接下来存一下,然后接下来咱们这个right对吧,存一下,然后C,然后这个呢,存一下咱们是不是单词,然后后边是什么,后边是不是咱们当前这个单词,它所在的我们这个文档啊对吧,这个后边是单词所在文档,注意我现在把第三行这条记录给它转换成这种形式,同学们能理解吗?可以跟什么,然后接下来,那么既然这个可以理解,那我相信下面这个对吧,那应该呢,你问题也不大对吧?那么它在咱们这里边对吧,Operation,然后湄公河对吧,然后咱们现在呢,这里发现operation是不是已经有了呀,那么有的话,是不是咱们在这后面加了一个二是不是就可以对吧?表示的是我当前这个operation呢,在一里边有,咱们二里边也有,然后呢,咱们民工对吧,在这里在二里边有对吧,到这咱们现在呢。
12:07
这是我们这个第二个文档,它分值之后它的一个效果,然后接下来那么咱们现在呢,第三个第三个对吧,这个东西呢,那也要去做一个分词对吧?那么在这里我现在呢,来对他们做一个分词的处理,对吧?分词处理,然后记得分词之后呢,发现这个东西这个没有,然后这个right和C是不是都有了呀,所以说呢,那这块应该是在咱三里边,在在咱们这里边三里边也有对吧,然后三里也有对吧?那目前把咱们现在这块的数据同学们对吧,由我现在这种形式转化成这种形式了,这个其实是不是就道白索引。对吧,能理解不能这会能理解,然后接下来那么咱们现在你呀,这个存的时候这么存的,那么你在查的时候,你这里是不是也要去查一下呀,对吧?首先呢,那么咱们现在在查的时候,它也要分词,注意了,在查询的时候呢,它也要分词,他会把它当前查询的内容呢,给分成这么三个词,对吧?那么operation发现在哪里有,是不是在一和二里边有,对吧?然后接下来在咱们这个red在哪里有,Red是不是在咱们的一和三里边有,然后进下来C在哪里有,一和三里边有,大家想一想,你一共呢有三个文档,那么其中咱们在查询这个值的时候,一这个文档是不是出现了特别多次,是不出现三次呀,但是三这文档呢,出现两次,二这文档是不是就命中了一次呀,所以说呢,他在咱们查询的时候,根据你的匹配度,它呢会对我们每一个文档做一个打分。
13:34
啊,根据每一门呢作业打分,咱们现在如果说要是我们这个一的话,注意I1的话,它的分呢是0.8几对吧,然后接下来那么如果说我现在呢,要是我们的AV3的话,它的分呢是0.5几,如果说要是为二的话,是0.2几对吧?注意啊,每一个我们这个搜索引擎里面,它除了竞价排名之外,它肯定还有什么呀,它肯定还有一个打分机制。
14:00
对吧,只不过打分占的比重是多少对吧,这个那就说不准了啊,因为你看咱们每一个一般一般他们在排名的时候肯定考虑因素很多,竞价排名是一方面,对吧,还有什么呀,有的一些官网对吧,或者是像咱们就说什么相关的这些网官网站肯定要给你往前放。对吧,哎,那么这块呢,是关于我们现在啊,它的一个这个查询对吧?整个这个内容呢,大家应该能看懂对吧,就是如果说咱们对把这个弄明白的话,那么你到目前为止你来search对吧,那我觉得还可以啊,好好把这个消化一下啊,好把这消化一下,那么这个呢,是我们现在第一个啊按照什么呢?按照分词查询啊按照分词查询,那么这里呢,它说必须使用什么呢?分使用我们这个分词态的类型,也就是说你必须得分词,我是不是才这么干呀,如果说你没有按照咱们现在这这想的这么多,这这这个东西把它分成我们的倒班作语的形式,对吧,是不是这个就不太合适啊对吧,老师还有不分词的情况有啊对吧,有可能我现在有一些专用的词语,对吧,往一块它就应该组合在一起,不应该来分词的,你就不应该给我切分,那么这个时候呢,对吧,那么你再使用这个插询的话就不太合适了,对吧?那怎么来看咱们现在分层不分词呢。
15:18
对吧,其实我们李连色是底层啊,对我字符串数据在保存的时候,它给你保存两份,一个呢是分词的,那么另外一个呢是不分词的,对吧?那么这两份分别什么类型的呢?大家可以看,可以看一下啊,来到这里我们呢去查询啊get啊,我们这个末位in代,然后接下来这个东西,我们说这些查询相当于是不是调用我的script对我当前的,所以呢来进行描述,对吧?先有一些印象的概念啊,比如说这个是所引名称,然后接下来索引的别名索有的映射,对这映射呢,其实就是我们当前的它里面一些我们这个关系什么类型呢?对吧?然后接下来,那么这里是索引的一个type,然后这块是属性,那么其中有一个属性叫什么呢?有一个属性啊叫ID,它的类型的是浪类型,有一个属性叫逗瓣评分,它的属性呢,是我们这个float的类型,对吧,那也就是说我们现在在处理的时候,大家看这个我们在加的时候啊,在加的时候。
16:16
你在进行添加的时候,ID咱们现在看写的是不是整数啊,它默认给你当做什么类型处理了,Long类型,那么咱们像豆瓣平分,我写的是不是浮点数,它默认帮什么来当做什么来进行处理了,是不是float的和Java不太一样吧,对吧?如果Java的话,咱们现在一看这些东西默认什么默认in的,一看这些东西默认什么double,但它不太一样对吧?它诶把这个当flow和我们这个呢来进行处理,然后接下来大家看其中内部是不是字符串呢?那么字符串呢,它在咱底层会保存两种类型,一个呢是test,这个test进行分词。啊,就是test进行分词,那么另外一个对吧,这个东西是不进行分词的,就相当于我现在这个东西,它其实还保存一份数据对吧?保存份数据什么呢?就是我们现在这个红外事件对吧?整个它没有分词,那么如果说你现在想完全匹配的话,把红外事间给我查出来,不进行分词,那么这个时候你应该用这种类型对吧?这个我下午会讲对吧,下午会讲,呃,那么咱们现在呢,把这个东西啊给大家对吧?这个建完之后下剩那些呢,咱们下午再说,然后剩个十分钟时间,然后大家呢,把上午内容简单看一看,然后最后这块是吧,就这个东西,如果说你对我们现在产品结果还有异议的话,你自己呢,把这个稍微看一看啊,稍微看一看,好,剩下时间给你们啊。
我来说两句