首页
学习
活动
专区
圈层
工具
发布

#索引

我相信很多人都答不好 Milvus 和 pgvector的区别

王中阳AI编程

在 AI 应用开发,尤其是 RAG 场景的面试中,Milvus 和 pgvector 经常被放在一起比较。

2900

RAG 检索全攻略:从原理到落地,一篇搞懂混合检索

tunsuy

RAG(Retrieval-Augmented Generation)的核心流程是:「先搜,再答」。

2300

RAG 向量数据库设计指南:从入门到生产

tunsuy

在 RAG 场景里:文本 → Embedding 模型 → 变成一串浮点数(向量)→ 存进去。用户提问时,问题也变成向量,然后找语义最接近的文本片段。

2300

SQLite需要初始化参数,怎么调优-- SQLite 五脏俱全系列 (1)

AustinDatabases

2 优化了索引的选择,让数据库可以选择更高效的索引而不是因为优化的时间的原因,选择一个低效的索引。

1700

分布式搜索引擎:底层逻辑 + 实战

果酱带你啃java

在分布式系统横行的今天,“数据查询”早已不是简单的数据库SELECT操作——当数据量突破TB级、并发查询达到万级QPS,传统单体搜索引擎(如Lucene)的性能...

3100

记录超长 – Long Row – 2665 – 达梦数据库

收心

免责声明: 本站文章旨在总结学习互联网技术过程中的经验与见解。任何人不得将其用于违法或违规活动!所有违规内容均由个人自行承担,与作者无关。

4100

我为什么想继续探索 ace-tool 这个方向

不换

现在大家做 AI Coding,特别容易越做越大。一开始可能只是想解决一个很具体的问题,比如“怎么让 Agent 更懂代码库”,结果做着做着,就开始想做索引、做...

5210

数据量大查询慢?索引让你的SQL秒级响应!|转行学DB第9天

数据库小学妹

前几篇我们学会了各种查询技巧:单表查、多表连、分组统计、子查询嵌套。但随着查询的数据越来越多,我就发现:

4910

使用 Elasticsearch 和 Jina Embeddings 进行无监督文档聚类

点火三周

从向量搜索到强大的 REST API,Elasticsearch 为开发人员提供了最全面的搜索工具包。您可以在 Elasticsearch Labs 仓库中的示...

6210

使用 Elasticsearch 和 Jina 嵌入的无监督文档聚类

点火三周

从向量搜索到强大的 REST API,Elasticsearch 为开发者提供了最全面的搜索工具包。您可以在 Elasticsearch Labs 仓库中查看我...

7210

一文搞懂Hermes:新顶流Agent如何从经验中自我进化

腾讯云开发者

当前的 Skill 匹配完全依赖 Agent 自己阅读索引后判断。如果 Skill 的名称和描述不够精准,或者用户的任务描述与 Skill 的触发条件有语义差距...

27430

IDEA官宣:终于可以爽用Junie CLI了!

GoLang学习记

JetBrains 最新搞了个大动作:Junie CLI 现在能自动检测并连接你正在运行的 JetBrains IDE,直接复用你配置好的代码索引、语义分析。一...

8410

刚刚!VS Code 官宣:终于可以玩视频了!

GoLang学习记

现在统一成一种状态:你的代码库要么已语义索引,要么没有。背后细节微软帮你管,用户不用操心。

6310

向量相似性搜索详解:Flat Index、IVF 与 HNSW

deephub

向量相似性搜索算法有多种,本文介绍以下四种:余弦相似度搜索、Flat Index、倒排文件索引(IVF)、HNSW(层次化可导航小世界)。

12210

京东大模型二面:你知道哪些方法可以提高RAG的检索正确率?

lyb-geek

RAG 系统里最容易被低估的环节,恰恰是检索。很多人把精力花在 Prompt 调优或者换更强的生成模型上,结果发现效果依然不理想——问题根本不在生成端,而是检索...

11410

RAG 的检索模块是怎么优化的?

lyb-geek

RAG(Retrieval-Augmented Generation)中的检索模块是整个系统的关键环节,直接影响生成结果的质量。为了提升检索的准确性、相关性和效...

6710

从零理解 RAG:LlamaIndex 入门指南

烟雨平生

LlamaIndex 的设计哲学是「数据优先」:一切从你的文档出发,帮你把数据变成可查询的索引,再把索引变成可交互的应用。

15310

从零搭建个人Wiki RAG:Karpathy范式的本地知识库

烟雨平生

核心区别:不需要向量数据库,不需要Embedding,不需要检索管线。 LLM读一个index.md全局索引,然后按需拉取具体的Wiki文章。

66510

10分钟带你从零搭建本地RAG:向量 + BM25 + RRF 混合检索,一篇就够+github完整源码

烟雨平生

首次运行会同时构建 FAISS 索引和 BM25 索引(大约 10–30 秒),之后每次直接加载。正常运行输出:

44510

向量数据库原理及在场景理解的应用

索旭东

索引是向量数据库的“发动机”。它通过特定的数据结构,将海量向量组织起来,使得搜索时无需遍历整个数据集。主流的索引算法包括:

9310
领券