Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >将RAG与CoT结合起来的技术,RAT减轻长文本生成出现的幻觉问题

将RAG与CoT结合起来的技术,RAT减轻长文本生成出现的幻觉问题

作者头像
否子戈
发布于 2024-05-03 05:57:29
发布于 2024-05-03 05:57:29
1.5K00
代码可运行
举报
文章被收录于专栏:
运行总次数:0
代码可运行

在过去的经验中,我们知道,CoT(思维链)模式可以降低大模型幻觉。简单讲,CoT就是让大模型按照步骤循序渐进(think step by step)地进行推理,而非直接一次给出答案,这种方式能让大模型在给出答案中将长链演算推理,变成具有规划性质的逐步迭代推导,因此,在一些逻辑推理性强的场景下能明显提升其效果。

但从另一个角度去思考,LLM的幻觉中有很大一部分是虚构事实,而这些情况的发生,总是因为用于训练大模型的知识不够实时,而无法提供符合客观事实的生成。而RAG(检索增强生成)技术则可以很好的解决这一问题,它通过检索外部知识,以增强LLM回复的可靠性。但是,RAG总是一次性提供相关信息,它很难预测后续的生成过程中,哪些是依据RAG提供的“事实”信息的。

基于上述思考,北京大学和相关机构的研究者们提出了一种新的尝试:通过外部知识的帮助(RAG),可以减轻中间推理过程(CoT)中的幻觉。并提出了RAT技术,RAT=CoT+RAG。发表论文《RAT: Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation》(https://arxiv.org/pdf/2403.05313)

上图示意了RAT的基本思路和原理。在没有CoT的情况下,命中事实概率低,在加入RAT的情况下,大幅提升命中事实概率。

在一系列基准测试下,RAT的表现都有明显的优势。

从论文的解释来看,我们有理由相信,RAT技术能明显提示大模型的质量。但是,其中的一些限制也很明显:依赖RAG的质量,性能下降,CoT本身的准确性也对最终的结果有重要影响。

另外,对于我们应用层开发的同学,我们都知道RAG是应用层的技术,而CoT是prompt触发机制(单轮),如何去实现RAT呢?流程主要为3阶段:

  • 生成初始prompt1以用于CoT
  • 基于初始答案拆分后的step生成RAG检索的prompt2
  • 把前两步的结果整合为修订后的prompt3,并让LLM给出最终结果
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
prompt1 = """
尝试用逐步的思考来回答这个问题\指令,并使答案更具结构化。
使用 `\n\n` 来将答案分成几个段落。
直接响应指令。除非被要求,否则不要在答案中添加额外的解释或介绍。
"""

prompt2 = """
我想验证给定问题的内容准确性,特别是最后几句话。
请用相应的问题总结内容。
这个总结将被用作必应搜索引擎的查询。
查询应该简短,但需要足够具体,以确保必应能够找到相关知识或页面。
您还可以使用搜索语法,使查询足够简短和清晰,以便搜索引擎能够找到相关的语言数据。
尽量使查询与内容中的最后几句话尽可能相关。
**重要**
直接输出查询。除非被要求,否则不要在答案中添加额外的解释或介绍。
"""

prompt3 = """
我想根据在维基百科页面上学到的相关文本来修订答案。
你需要检查答案是否正确。
如果你在答案中发现了错误,请修订答案使其更好。
如果你发现有些必要的细节被忽略了,请根据相关文本添加这些细节,以使答案更加可信。
如果你发现答案是正确的且不需要添加更多细节,请直接输出原始答案。
**重要**
尽量保持修订后答案的结构(多个段落及其子标题),使其更具结构性以便理解。
用 `\n\n` 字符分隔段落。
直接输出修订后的答案。除非被要求,否则在修订后的答案中不要添加额外的解释或声明。
"""

你可以通过开源代码来自己测试其效果 https://craftjarvis.github.io/RAT/。

我们也可以基于workflow来自己搭建这个流程,通过应用层的设计来实现相同的效果。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 唐霜 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
首先,我们将 RAG 工作流程分为三个部分,以增强我们对 RAG 的理解,并优化每个部分以提高整体性能:
致Great
2025/02/22
4570
从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
检索增强生成 和思维链 结合: 如何创建检索增强思维链 (RAT)?
Github地址:https://github.com/CraftJarvis/RAT
致Great
2025/01/05
2020
检索增强生成 和思维链 结合: 如何创建检索增强思维链 (RAT)?
RAT:融合RAG和CoT的高效多步推理任务策略
今天分享的是由北京大学、加州大学洛杉矶分校和北京通用人工智能研究院合作发表的一篇文章
AI研思录
2025/02/20
2000
RAT:融合RAG和CoT的高效多步推理任务策略
OpenAI主管Lilian Weng分享RAG对抗LLM幻觉策略
2024年7月7号,OpenAI安全团队负责人,Lilian Weng分享了一篇博客介绍了LLM中幻觉的由来、检测和对抗策略,分享给大家,以下为翻译全文。
AgenticAI
2025/03/18
1030
OpenAI主管Lilian Weng分享RAG对抗LLM幻觉策略
RAG科普文!检索增强生成的技术全景解析
增强生成 (RAG) 是塑造应用生成式 AI 格局的关键技术。Lewis 等人在其开创性论文中提出了一个新概念面向知识密集型 NLP 任务的检索增强生成之后,RAG 迅速成为基石,提高了大型语言模型 (LLM) 输出的可靠性和可信度。
致Great
2025/02/15
6090
RAG科普文!检索增强生成的技术全景解析
“提示工程”的技术分类
尽管大模型非常强大,但仍然有着自身的局限。大模型可以生成看起来非常值得信赖的内容并引用外部资源,但是,大模型本身并不能直接访问互联网也不能访问互联网的资源。偏见往往会使大模型产生某些定型的内容。当被问到一个不知道答案的问题时,大模型有时会产生“幻觉”或者产生错误的信息, 很多时候,即使是最简单的数学或常识的问题, 大模型仍然要挣扎一番。另外,通过操纵提示词,以忽略开发人员的指令并生成特定的内容。
半吊子全栈工匠
2024/08/01
1640
“提示工程”的技术分类
LLM RAG系列
本文介绍了RAG以及RAG pipeline的整个流程,包括请求转换、路由和请求构造、索引和检索、生成和评估等,其中引用了大量有价值的论文。
charlieroro
2024/04/02
7970
LLM RAG系列
RAG七十二式:2024年度RAG清单
回顾2024,大模型日新月异,智能体百家争鸣。作为AI应用的重要组成部分,RAG也是“群雄逐鹿,诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩,年中开源工具如火如荼、知识图谱再创新机,年末图表理解、多模态RAG又启新征程,简直“你方唱罢我登场”,奇技叠出,不胜枚举!
AI研思录
2025/02/20
1560
RAG七十二式:2024年度RAG清单
Prompt提示工程上手指南(六):AI避免"幻觉”(Hallucination)策略下的Prompt
这是本系列的第六篇文章,在这篇中我们需要了解并处理语言模型最为棘手的问题,也就是AI"幻觉”(Hallucination)问题。在大型语言模型和聊天机器人的世界里,"幻觉"现象指的是这些智能系统有时会基于给定的提示,创造出并不存在的信息或事实。简而言之,就是这些先进的AI在对话过程中可能会偶尔"脱轨",提供与问题无关的回答,或者讲述一些与现实不符的内容。这种现象反映了AI在理解和生成语言时,尽管它们通常表现出色,但有时仍会犯错或产生与期望不符的输出。
fanstuck
2024/03/25
2.3K1
Prompt提示工程上手指南(六):AI避免"幻觉”(Hallucination)策略下的Prompt
提示工程(prompt engineering):技术分类与提示词调优看这篇就够了
在人工智能盛起的当下,出现了一个新兴的行业——提示工程(prompt engineering)。提示词,简言之,就是我们和AI说的话。在人机交互模式下,一个好的提示词,往往能产生事半功倍的效果。文本领域,好的提示词往往能超越RAG/Agent所能发挥的能力;图片对应的视觉领域,好的提示词往往能产生更好地图片/视觉效果。
山行AI
2024/04/30
3.8K0
提示工程(prompt engineering):技术分类与提示词调优看这篇就够了
同济大学发布最新检索增强(RAG)的LLM生成技术综述
摘要主要介绍了大型语言模型(LLMs)在实际应用中面临的挑战,比如幻觉、知识更新缓慢和答案缺乏透明度等问题,并提出了检索增强生成(Retrieval-Augmented Generation,RAG)作为一种解决方案。RAG通过从外部知识库检索相关信息来辅助大型语言模型回答问题,已经被证明能显著提高回答的准确性,减少模型产生的幻觉,尤其是在知识密集型任务中。
唐国梁Tommy
2023/12/21
16.8K0
同济大学发布最新检索增强(RAG)的LLM生成技术综述
检索增强生成 (RAG) 的 5 大 提示词,非常实用!
从去年到现在,检索增强生成(RAG)这套玩法越来越火。简单来说,它就是让大型语言模型(LLM)结合外部数据,确保回答更准确、不胡说八道(减少“幻觉”)。这样一来,RAG 系统不仅能给出更靠谱的答案,还能紧跟最新信息。
致Great
2025/03/15
3010
检索增强生成 (RAG) 的 5 大 提示词,非常实用!
干货!带你了解7种检索增强生成 (RAG) 技术
在简单RAG中,大型语言模型(LLM)接收用户查询,在向量存储库中进行相似性搜索或在知识图谱中进行关系搜索,然后基于检索到的信息生成答案。
致Great
2025/01/06
4.7K0
干货!带你了解7种检索增强生成 (RAG) 技术
RAG 修炼手册|如何评估 RAG 应用?
如果你是一名用户,拥有两个不同的 RAG 应用,如何评判哪个更好?对于开发者而言,如何定量迭代提升你的 RAG 应用的性能?
Zilliz RDS
2024/04/25
7510
RAG 修炼手册|如何评估 RAG 应用?
RAG 技术综述
检索增强生成(Retrieval Augmented Generation,简称 RAG)向 LLM 提供了从特定数据源检索的信息,以此作为生成答案的基础。简而言之,RAG 结合了搜索和 LLM 的提示功能,在此基础上,模型根据搜索算法提供的信息,作为上下文来回答问题。这些查询和检索到的上下文会一并被注入到发送给 LLM 的提示中。
科技之歌
2024/02/01
1.6K0
RAG 技术综述
【RAG】001.1-RAG相关核心概念
RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合信息检索与生成模型的混合架构,旨在提升生成的准确性和可信度。其核心概念可归纳为以下六个方面:
訾博ZiBo
2025/03/26
2080
2024技术总结:LLM之RAG技术全栈进化解析、Agent应用案例精选、LLM大模型部署实战指南
嘿,大家好!作为一名技术宅,我在2024年与AI的大型语言模型(LLM)技术有了不少“亲密接触”,感觉就像是和一位日益聪明的老友并肩前行。
汀丶人工智能
2025/01/25
4780
2024技术总结:LLM之RAG技术全栈进化解析、Agent应用案例精选、LLM大模型部署实战指南
RAG的10篇论文-2024Q1
在大型模型的研究与工程应用领域,变化之迅猛令人瞠目,用“日新月异”来形容似乎都显得有些保守。即便是针对其中的RAG技术,自2024年伊始至今,学界就已经涌现出了很多高质量的研究论文。在这里,老码农挑选了十篇具有代表性的作品,以期对大家的探索和实践提供有益的参考与启示。
半吊子全栈工匠
2024/04/22
1.9K0
RAG的10篇论文-2024Q1
Prompt提示工程上手指南:基础原理及实践(四)-检索增强生成(RAG)策略下的Prompt
此篇文章已经是本系列的第四篇文章,意味着我们已经进入了Prompt工程的深水区,掌握的知识和技术都在不断提高,对于Prompt的技巧策略也不能只局限于局部运用而要适应LLM大模型的整体框架去进行改进休整。较为主流的LLM模型框架设计可以基于链式思考(CoT)、思维树 (ToT)和检索增强生成 (RAG)。其中RAG框架可以算得上是AI平台研发的老生常谈之一了,因为无论是个人还是企业,都想要培养出一个属于自己领域专业的AI。但伴随而来的问题,不限于产生幻觉、缺乏对生成文本的可解释性、专业领域知识理解差,以及对最新知识的了解有限。
fanstuck
2024/02/28
2K3
Prompt提示工程上手指南:基础原理及实践(四)-检索增强生成(RAG)策略下的Prompt
深度解析RAG技术在大模型时代的原理与实践
AI 日报_硅谷 “鲁迅” 怒怼马斯克_炮轰 AI 界 * 前 OpenAI 安全主管入职友商 Anthropic
可信AI进展
2024/06/03
2.6K0
推荐阅读
相关推荐
从零开始优化 RAG 流程的终极指南,解决检索增强生成的核心挑战
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文