前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【RAG】六步学习检索增强(RAG),打造你的私域助理

【RAG】六步学习检索增强(RAG),打造你的私域助理

原创
作者头像
Freedom123
发布2024-05-01 19:33:35
1380
发布2024-05-01 19:33:35
举报
文章被收录于专栏:AIGC

toc


每个人似乎都在担心人工智能会如何夺走我们的工作。但令人惊讶的是,很少有人真正了解在实际环境中使用人工智能模型的基本方面。到目前为止,大多数技术人员都听说过 RAG - Retrieval Augmented Generation。简单来说,RAG 只是一种将文档或某些知识源链接到 AI 模型的方法。如果您正在考处理5 个文档,这听起来很容易。但是,如果让您考虑任何人或公司如何需要对数千、数万或数百万个文件执行此操作,则这是一个不同的问题。这是几乎所有公司都存在的问题。这就是为什么我大力倡导每个人至少对 RAG 是什么有基本的了解,因为它是使用 AI 模型所需的基本知识之一。

与生活中的任何事情一样,如果你认真对待它,这将是成为人工智能专家的起点。即使您对成为 AI 专家不感兴趣,了解 RAG 的所有部分的工作原理也肯定会为您提供良好的服务,因为许多公司将整合这些工作流程。

第一步:Parsing(解析), Text Chunking(文本分块), Indexing(索引)

这里,你需要了解什么怎么对文本进行分块,如何创建您的第一个库并开始执行基本步骤,库中的文档需要解析为统一的格式,并分成更小的文本(分块),然后使用所有元数据进行索引。

第二步:Build Embeddings(构建嵌入)

你需要了解什么是嵌入、嵌入模型、向量和向量数据库?学习嵌入、嵌入模型、向量和向量数据库背后的基本概念。

您需要使用 Hugging Face 中的模型构建您的第一个嵌入,以存储到数据库并使用这些嵌入来运行查询。

第三步:Prompt Models(提示词模型)

了解如何通过加载和提示来自 Hugging Face 和 OpenAI 的模型来提示模型。使用示例开始推理模型,并了解如何使用传递的上下文检查模型是否提供了正确的答案。了解如何捕获模型的使用情况数据,例如令牌使用、输出和总处理时间。

第四步:RAG with text query(通过检索增强查询文本)

我们需要在带有嵌入的库中获取某种形式的知识,并将这些碎片与模型组合在一起。了解如何将正确的 RAG 策略与深思熟虑的检索和查询策略结合使用正确的模型来完成工作。

第五步:RAG with Semantic Query(通过检索增强进行语义查询)

现在,您可以开始语义搜索了。也称为自然语言查询,这是我们获得嵌入和向量数据库的好处的地方。您将能够使用自然语言查询您的知识库,以提出问题,以便从最复杂的法律文件中获得答案。

第六步:RAG with Multi-Step, Hybrid Query(通过检索增强进行多步混合查询)

并学习如何在笔记本电脑上使用 Hugging Face 中的量化 DRAGON-YI-6b-GGUF 模型,执行多步骤混合查询以获得所需的响应。此外,了解如何执行证据验证(防止模型幻觉)以及如何将所有输出保存为 JSON 或 CSV 文件,以供将来的数据集或审核使用。

我正在参与2024腾讯技术创作特训营最新征文,快来和我瓜分大奖!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
向量数据库
腾讯云向量数据库(Tencent Cloud VectorDB)是一款全托管的自研企业级分布式数据库服务,专用于存储、检索、分析多维向量数据。该数据库支持多种索引类型和相似度计算方法,单索引支持千亿级向量规模,可支持百万级 QPS 及毫秒级查询延迟。腾讯云向量数据库不仅能为大模型提供外部知识库,提高大模型回答的准确性,还可广泛应用于推荐系统、自然语言处理等 AI 领域。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档