技术栈:Obsidian · AI Agent 框架 · SQLite FTS5 · Python
GSK(中国) | 全栈架构师 (已认证)
让这颗大脑真正有用的东西,叫 Harness:套在 LLM 外面的运行时脚手架,给它装上感官、双手和记忆。事件接入、Agent 编排、持久化状态、自愈循环、可观...
在人工智能发展史上,2026年被视为大语言模型(LLM)从“技术奇点”转向“产业奇点”的关键节点。这一转变的核心驱动力已不再仅仅是模型参数规模的线性扩张,而是围...
设想你和一个 AI 助手聊了三个月。某天你问它:「我朋友 Caroline 七月那会儿在忙什么来着?」
这个问题听起来既科幻又有点危险。它指向 AI 圈子里一个长期被搁置的概念——Recursive Self-Improvement(RSI,递归自我改进)。它由 ...
让我们先看看主流 Video LLM 的标准架构:一个 Vision Transformer 把视频逐帧编码成 token,对齐到 LLM 的 embeddin...
过去两年,让大模型"会思考"的主流路径是 Chain-of-Thought:模型在给答案前先把推理过程一段段地"说出来"。它有效,但也有清晰的代价——输出越长,...
那个高维空间,就是这两年"机制可解释性""激活引导""latent reasoning"都在围着转的 latent space。要真正看懂今天的 LLM,你必须...
Schema(行为约束层) —— 决定页面命名规则、新建时机、引用规范、矛盾处理方式。没有 Schema,LLM 只是写作者;有了 Schema,LLM 才是知...
很多人一提到 Agent,第一反应就是:给大模型接上搜索、数据库、浏览器、代码解释器,再加几个 API,它不就能自己干活了吗?
长期以来,研究者们一直盯着 Transformer 结构中那个最“臃肿”的部分——前馈网络(FFN)。在现代 LLM 中,FFN 占据了超过三分之二的参数量和 ...
今天,我们要深入探讨一个大语言模型(LLM)领域的核心议题:后训练(Post-Training)。当我们谈论让一个基础模型(如Llama、Qwen)变得更强大、...
RL4LLM(Reinforcement Learning for LLM)的初衷是好的:通过奖励信号,引导模型生成更高质量的推理过程。然而,由于LLM训练的复...
今天,我们要深入探讨一篇来自微软研究团队的重磅论文。如果你也对大语言模型(LLM)的未来充满期待,同时又对其惊人的计算成本感到忧虑,那么这篇论文绝对不容错过。它...
就在我们似乎陷入僵局时,一篇来自清华大学与字节跳动合作的论文《MemAgent: Reshaping Long-Context LLM with Multi-C...
LLM Agent,这个概念大家可能已经不陌生了。它就像一个拥有超级大脑(LLM)的“数字员工”,能够自主规划、调用工具(如搜索引擎、计算器、代码执行器),一步...