小七的各种胡思乱想

代码在线跑，知识轻松学

Python精品学习库

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

博客搬家 | 分享价值百万资源包

往期视频·干货材料·成员作品 最新动态

技术创作特训营·精选知识专栏

新邀入驻腾讯云开发者社区，福利多多！

如何运用「云、端融合的数智化安全体系」高效护航数据安全

左手AI，右手安全 —— 一汽丰田数字化转型之路

在大模型驱动的时代，向量模型、索引抽取模型、文本切分模型（chunking）的迭代速度令人目不暇接，几乎每几个月就要升级一次。随之而来的，是Elasticsearch索引结构的频繁变更需求。然而，ES有个众所周知的‘硬伤’：一旦字段的mapping设定，就无法直接修改！ 这意味着每次模型升级带来的字段调整，都绕不开一个耗时费力的过程——重建索引并迁移数据（Reindex）。面对高频迭代，低效的Reindex和数据迁移导致的线上服务中断风险，成了工程师们挥之不去的烦恼。

ES索引迁移优化：3倍速ReIndex + 零感知切换

记忆存储是构建智能个性化、越用越懂你的Agent的核心挑战。上期我们探讨了模型方案实现长记忆存储，本期将聚焦工程实现层面。

解密prompt系列55.Agent Memory的工程实现 - Mem0 & LlamaIndex

Context Cache的使用几乎已经是行业共识，目标是优化大模型首Token的推理延时，在多轮对话，超长System Prompt，超长结构化JSON和Few-shot等应用场景，是不可或缺的。这一章我们主要从原理、一些论文提出的cache优化项和VLLM开源项目入手，分析下context Cache的实现和适合场景。

​解密prompt系列54.Context Cache代码示例和原理分析

哈哈最近感觉自己不像算法倒像是DB，整天围着ES打转，今天查IO，明天查内存，一会优化查询，一会优化吞吐。毕竟RAG离不开知识库，我们的选型是ES，于是这一年都是和ES的各种纠葛。所以顺手把近期获得的一些小tips记下来，万一有人和我踩进了一样的坑，也能早日爬出来。当前使用的ES版本是8.13，和7版本有较大的差异，用7.X的朋友这一章可能有不适配。本章主要覆盖以下

​ES查询优化随记1: 多路向量查询 & KNN IO排查 & 高效Filter使用

上一章畅想里面我们重点提及了大模型的记忆模块，包括模型能否持续更新记忆模块，模型能否把持续对记忆模块进行压缩更新在有限的参数中存储更高密度的知识信息，从而解决有限context和无限知识之间的矛盾。这一章我们分别介绍两种方案，一种是基于模型结构的Google提出的Titan模型结构，另一种是基于外挂知识库表征对齐的Kbalm。

解密prompt系列53. 再谈大模型Memory

在DeepSeek-R1的开源狂欢之后，感觉不少朋友都陷入了技术舒适区，但其实当前的大模型技术只是跨进了应用阶段，可以探索的领域还有不少，所以这一章咱不聊论文了，偶尔不脚踏实地，单纯仰望天空，聊聊还有什么有趣值得探索的领域，哈哈有可能单纯是最近科幻小说看太多的产物~

解密prompt系列52. 闲聊大模型还有什么值得探索的领域

DeepSeek R1出来后业界都在争相复现R1的效果，这一章我们介绍两个复现项目SimpleRL和LogicRL，还有研究模型推理能力的Cognitive Behaviour，项目在复现R1的同时还针对R1训练策略中的几个关键点进行了讨论和消融实验，包括

解密prompt系列51. R1实验的一些细节讨论

OpenAI新推出的Deep Research功能，属实有些惊艳，也验证了去年的一些观点，之后的大模型工作流会呈现一些截然不同的形态，有敏捷型的例如语音端到端的及时对话，也会有异步长流程的复杂任务，去做例如课题研究，信息收集,实验设计，假设验证等等。

解密prompt系列50. RL用于优化Agent行为路径的一些思路

在所有人都在谈论R1的今天，作为算法也是有些千头万绪无从抓起。所以这一章先复盘，我先按照自己的思路来梳理下R1之前整个模型思维链的发展过程。下一章再展望主要去看RL在Agent上的一些尝试，毕竟Agent规划和长思考的本质是非常像的，在优化中面临的问题也是类似的。

​解密prompt系列49. 回顾R1之前的思维链发展

春节前DeepSeek R1和Kimi1.5炸翻天了，之前大家推测的O1的实现路径，多数都集中在MCTS推理优化，以及STaR等样本自优化方案等等，结果DeepSeek和Kiim直接出手揭示了reasoning的新路线不一定在SFT和Inference Scaling，也可以在RL。也算是Post Train阶段新的Scaling方向，几个核心Take Away包括

​解密prompt系列48. DeepSeek R1 & Kimi 1.5长思维链 - RL Scaling

但O1之后，思维链一个简单但之前都没进入视野的特征引起了大家的注意，那就是思考的长度对推理效果的影响，更准确来说是通过哪些思考步骤来有效延长思维长度对推理的影响。这一章我们着重讨论思考长度，慢思考的一些特点，下一章再讨论一些实现方案。哈哈注意这里的很多观点都是各方推测，请辩证看待~

解密prompt系列47. O1 Long Thought的一些特征分析

最近闭源大模型们都陆续支持结构化输出，这一章我们先结合demo看下开源和闭源对结构化输出的支持，随后会介绍Constrained Decoding和Format Restricting Instructions 两种结构化输出约束方案，最后会给出结构化输出对比自然语言输出的一些观点。

解密prompt系列46. LLM结构化输出代码示例和原理分析

之前我们已经介绍过几个针对Scalable Oversight的解法，也就是当模型能力在部分领域超越人类标注者后，我们该如何继续为模型提供监督信号，包括

解密Prompt45. 再探LLM Scalable Oversight -辩论、博弈哪家强

前一阵多步RAG的风吹入了工业界，kimi推出了探索版本，各应用都推出了深度搜索，You.COM更是早就有了Genius的多步模式。其实都是类似multi-hop RAG的实现。之前学术界在讨论multi-hop RAG的时候总是给一些基于历史知识类的问题，什么某年诺贝尔奖的获奖人在哪读的大学呀，给人一种错觉就是这类问题现实世界里真的有人这么提问么？其实还真有！

解密prompt系列44. RAG探索模式？深度思考模式？

前一章我们介绍了基于模型自我合成数据迭代，来提升LLM生成更合理的自我推理思考链路。但在模型持续提升的道路上，只提升Generator能力是不够的，需要同步提升Supervisor、Verifier的能力，才能提供有效的监督优化信号。

解密prompt系列43. LLM Self Critics

最近大家都在探讨和尝试复现OpenAI O1的思考效果，解码出的关键技术方向，包括之前已经探讨过的Inference Time Scaling在推理过程中进行路径决策和选择。但想要更优的Inference Time Scaling曲线，前提是模型本身是一个很强的Generator，已经拥有足够的生成合理推理过程的能力，同时还拥有很强的Verifier模型来对推理节点进行打分决策，并且二者可以在少人类监督的条件下不断迭代优化。

解密prompt系列42. LLM通往动态复杂思维链之路

这一章我们介绍GraphRAG范式，算着时间也是该到图谱了，NLP每一轮新模型出来后，往往都是先研究微调，然后各种预训练方案，接着琢磨数据，各种主动学习半监督，弱监督，无监督，再之后就到图谱和对抗学习~

解密prompt系列41. GraphRAG真的是Silver Bullet？

OpenAI的O-1出现前，其实就有已经有大佬开始分析后面OpenAI的技术路线，其中一个方向就是从Pretrain-scaling，Post-Train-scaling向Inference Scaling的转变，这一章我们挑3篇inference-scaling相关的论文来聊聊，前两篇分别从聚合策略和搜索策略来优化广度推理，最后一篇全面的分析了各类广度深度推理策略的最优使用方案。

解密prompt系列40. LLM推理scaling Law

RAG的部分我们之前讨论过信息召回的多样性，信息密度和质量，主要集中在召回，融合，粗排的部分。这一章我们集中看下精排的部分。粗排和精排的主要差异其实在于效率和效果的balance。粗排模型复杂度更低，需要承上启下，用较低复杂度的模型，在大幅度缩小召回候选量级的基础上，和精排的排序一致性做尽可能的对齐，保证精排高质量内容不被过滤。而精排模型复杂度更高，可以使用更复杂的模型来尽可能地拟合最终的目标排序。在RAG任务中，最终目标就是候选内容可以回答问题，客观评估就是推理引用率。

解密prompt系列39. RAG之借助LLM优化精排环节

常见的多智能体框架有几类，有智能体相互沟通配合一起完成任务的例如ChatDev，CAMEL等协作模式, 还有就是一个智能体负责一类任务，通过选择最合适的智能体来完成任务的路由模式，当然还有一些多智能体共享记忆层的复杂交互模式，这一章我们针对智能体路由，也就是选择最合适的智能体来完成任务这个角度看看有哪些方案。

解密Prompt系列38.多Agent路由策略

文章

问答

视频

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋 

腾讯云代码助手

CODING DevOps

Cloud Studio

SDK中心

API中心

命令行工具

腾讯云开发者社区推出了小七的各种胡思乱想专栏，为你提供了小七的各种胡思乱想的相关文章，致力于帮助开发者快速成长与发展。

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐