首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签全文检索

#全文检索

从文本或数据库中,不限定数据字段,自由地萃取出消息的技术

为什么 Apache Doris 是比 Elasticsearch 更好的实时分析替代方案?

SelectDB技术团队

从 2.0 版本开始,Doris 也支持倒排索引和 BKD-Tree 索引,能够进行精确匹配和全文检索。向量检索目前通过向量距离函数实现,未来将支持向量索引加速...

22910

如何高效提升大模型的RAG效果?多种实用策略一次掌握

fanstuck

持续提升RAG(检索增强生成,Retrieval-Augmented Generation)的效果是当前许多企业应用大模型时非常关注的一个关键问题。虽然RAG看...

27332

秒懂!5分钟图解 Elasticsearch 搜索原理,快速掌握全文检索技术!

程序视点

先自上而下,后自底向上的介绍ElasticSearch的底层工作原理,试图回答以下问题:

29210

LLM的检索增强--SELF-RAG

云帆沧海

*《SELF-RAG: LEARNING TO RETRIEVE, GENERATE, AND CRITIQUE THROUGH SELF-REFLECTION...

17410

值得收藏的文献检索工具

cytotry

杭州百科博创生物科技有限公司 | 总经理 (已认证)

1. 灯塔学术(https://www.dotaindex.com/scholar)

32900

人类情境检索数据集中的开源(免费)和付费模型比较,开源模型甚至可提供更高准确度

DenserAI_Chris

概述:DenserRetriever 是一个检索器平台,支持关键字搜索、向量搜索和重新排序,它为构建 RAG 应用程序提供了有效的解决方案。我们在 Denser...

13810

从 Elasticsearch 到 Apache Doris 腾讯音乐内容库升级,统一搜索分析引擎,成本直降 80%

SelectDB技术团队

导读: 为满足更严苛数据分析的需求,腾讯音乐内容库借助 Apache Doris 替代了 Elasticsearch 集群,统一了内容库数据平台的内容搜索和分析...

58310

MiniCPM-V 系列模型在多模态文档 RAG 中的应用:无需OCR的高效多模态文档检索与问答系统

用户7634387

本文出处:https://github.com/RhapsodyAILab/Awesome-MiniCPMV-Projects/tree/main/visrag

98410

Lucene索引文件解析

Yiwenwu

腾讯 | 后台开发工程师 (已认证)

Lucene作为最优秀的开源搜索引擎,内部实现了复杂的架构和算法,用来支撑对海量数据的存储和搜索。Lucene的存储和搜索都与底层的索引文件息息相关,Lucen...

43820

大数据组件:Lucene全文索引与搜索

Yiwenwu

腾讯 | 后台开发工程师 (已认证)

Lucene是一款高性能、可扩展的信息检索工具库,是用于全文检索和搜寻的Java开放源码程序库,最初是由Doug Cutting所撰写,2000年发行了第一个开...

42020

全文检索、向量检索和混合检索的比较分析

大数据杂货铺

畅游当今的信息海洋既是一个奇迹,又是一个迷宫。全文和矢量搜索使我们能够构建搜索体验,使用户能够找到相关的产品、内容等。随着我们对搜索精度和上下文的追求不断发展,...

3.2K10

MySQL 模糊查询再也不用like+%了

码猿技术专栏

我们都知道 InnoDB 在模糊查询数据时使用 "%xx" 会导致索引失效,但有时需求就是如此,类似这样的需求还有很多。

29710

RAG智能问答系统为什么要使用混合检索?(完整版)

产品言语

检索增强生成简称RAG(Retrieval-augmented Generation),RAG为大语言模型安装了知识外挂,基础大语言模型不用训练,通过RAG技术...

2.1K10

SpringBoot+ElasticSearch实现文档内容抽取、高亮分词、全文检索

码猿技术专栏

介绍下代码实现逻辑:文件上传,数据库存储附件信息和附件上传地址;调用es实现文本内容抽取,将抽取的内容放到对应索引下;提供小程序全文检索的api实现根据文件名称...

1.6K10

Linux 安装部署 Elasticsearch 8.5.0

是条鱼呀

进入config/jvm.options.d 目录,新建 jvm.options 文件, 添加以下内容

38200

MySQL 全文索引

政采云前端团队

实际开发过程中,我们经常会遇到全文检索的述求,一般都会采用搭建ES服务器来实现。但因为数据量较少,并且不属于高并发高吞吐场景,相比较而言接入 ES,不仅会使得系...

35410

全文检索的极致之选:Elasticsearch完全指南

用户1413827

倒序索引也被称为“反向索引”或“反向文件”,是一种索引数据结构。倒序索引在“内容”和存放内容的“位置”之间的映射,其目的在于快速全文索引和使用最小处理代价将新文...

1.1K10

【迅搜03】全文检索、文档、倒排索引与分词

硬核项目经理

今天还是概念性的内容,但是这些概念却是整个搜索引擎中最重要的概念。可以说,所有的搜索引擎就是实现了类似的概念才能称之为搜索引擎。而且今天的内容其实都是相关联的,...

57410

全新Self-RAG框架亮相,自适应检索增强助力超越ChatGPT与Llama2,提升事实性与引用准确性

汀丶人工智能

大型语言模型(LLMs)具有出色的能力,但由于完全依赖其内部的参数化知识,它们经常产生包含事实错误的回答,尤其在长尾知识中。

1.8K10
领券
首页
学习
活动
专区
圈层
工具