温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
各位观众大家好,欢迎来到今天的演示和互动环节。我们或许对elastic search并不陌生,Elastic search在全文检索领域一直是开发者的首选搜索引擎,但今天我们将为大家介绍你可能不知道的腾讯云ES一站式的检索增强生成RA解决方案。随着技术的发展,腾讯云as已经不仅仅局限于传统的文本搜索功能,它已经进化为一个更强大的AI搜索平台,不仅可以满足全文检索的需求,还支持稀疏向量检索、密集向量检索与混合检索,并且可以结合大模型来生成答案。接下来,我们将通过一个简单的演示,带大家逐步了解腾讯云ES的一站式rag解决方案。首先我们体验ES是如何处理查询与数据的。大家可以看到,传统的ES通过分词技术,例如BM25算法,对输入的查询词进行处理,并返回相关的文档。其工作原理简单来说就是当我们输入句子腾讯云ES的优势时,As通过分词器将句子拆分成多个用于检索的关键词,并在文档中进行匹配和打分。
01:20
但往往简单的分词并不能正确理解我们的需求,比如ES,我们实际希望它能召回包含1拉search的相关内容,所以分词技术需要通过各种方法进行优化,比如同义词,这对开发人员的要求相对比较高,但现在我们可以做的更多。腾讯云ES提供了基于稀疏向量的词扩展功能,这不仅仅是简单的关键词匹配,而是通过扩展词库增加检索的广度和深度。比如我们查询shanhen,词扩展功能将帮我们召回更多的信息,比如经济、广东工业等。腾讯云as还提供了向量生成,通过向量空间的相似性帮我们找到相似的内容。
02:14
这同样是在搜索领域对全文检索技术的补充。接下来我们体验一下ES如何进行搜索与召回。我们查询腾讯云ES和elas k何时开始合作,通过切换不同的查询方法,我们可以清楚的看到不同的搜索技术。可以提供差异化的召回结果。我们需要合理的选择和组合不同的搜索技术以达到最优的效果。但大多数时候,单一的搜索技术无法解决所有的问题,使用混合搜索会是更好的选择。比如我们搜索腾讯云as在Lucy上的最新贡献时,混合搜索能给我们提供最优的返回结果。
03:21
第三步,我们体验ES加会员大模型是如何生成答案。通过设置合理的系统提示,我们再将用户提问与返回结果作为上下文一起提供给大模型。会员大模型将快速的理解和解读我们的问题和材料,然后给我们一个精准且易于理解的方案。
04:02
最后,我们还准备了一些小彩蛋,可以看看我们一站式的解决方案中,我们是如何同步数据,如何清洗数据,以及如何监控整个rag的生命周期的。啊。
我来说两句