首页
学习
活动
专区
圈层
工具
发布

#LLM

LLM-Wiki企业级AI知识库实战教程

用户12587183

技术栈:Obsidian · AI Agent 框架 · SQLite FTS5 · Python

8610

一个 LLM 是大脑,套上 Harness 才是工程师

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

让这颗大脑真正有用的东西,叫 Harness:套在 LLM 外面的运行时脚手架,给它装上感官、双手和记忆。事件接入、Agent 编排、持久化状态、自愈循环、可观...

8310

2026年全球LLM定价权演进、商业模式重构与成本效益分析深度报告

jeffery_jcm

在人工智能发展史上,2026年被视为大语言模型(LLM)从“技术奇点”转向“产业奇点”的关键节点。这一转变的核心驱动力已不再仅仅是模型参数规模的线性扩张,而是围...

13010

记忆不是被检索出来的,而是被重建出来的:给 LLM Agent 装上一颗会联想的大脑

唐国梁Tommy

设想你和一个 AI 助手聊了三个月。某天你问它:「我朋友 Caroline 七月那会儿在忙什么来着?」

10510

RSI 递归自我改进:让 LLM 自己来设计下一代的 LLM

唐国梁Tommy

这个问题听起来既科幻又有点危险。它指向 AI 圈子里一个长期被搁置的概念——Recursive Self-Improvement(RSI,递归自我改进)。它由 ...

12010

Google DeepMind:视频大模型的真正瓶颈,从来不在 LLM 那一端

唐国梁Tommy

让我们先看看主流 Video LLM 的标准架构:一个 Vision Transformer 把视频逐帧编码成 token,对齐到 LLM 的 embeddin...

7110

想让LLM多想几轮,又不想显存爆炸?MELT 把循环 Transformer 的 KV 缓存解耦了

唐国梁Tommy

过去两年,让大模型"会思考"的主流路径是 Chain-of-Thought:模型在给答案前先把推理过程一段段地"说出来"。它有效,但也有清晰的代价——输出越长,...

10510

大模型到底是怎么"思考"的?看懂 Token Space 与 Latent Space,你才真的理解了 LLM

唐国梁Tommy

那个高维空间,就是这两年"机制可解释性""激活引导""latent reasoning"都在围着转的 latent space。要真正看懂今天的 LLM,你必须...

8810

聊天是入口,Wiki 才是产品:LLM 知识运行时的范式转移

唐国梁Tommy

Schema(行为约束层) —— 决定页面命名规则、新建时机、引用规范、矛盾处理方式。没有 Schema,LLM 只是写作者;有了 Schema,LLM 才是知...

13310

LLM会用工具,不等于真正会干活:哈工大最新综述把 AI Agent 讲透了

唐国梁Tommy

很多人一提到 Agent,第一反应就是:给大模型接上搜索、数据库、浏览器、代码解释器,再加几个 API,它不就能自己干活了吗?

9010

一文读懂 NVIDIA 与 Sakana AI 联手打造的稀疏 LLM 黑科技

唐国梁Tommy

长期以来,研究者们一直盯着 Transformer 结构中那个最“臃肿”的部分——前馈网络(FFN)。在现代 LLM 中,FFN 占据了超过三分之二的参数量和 ...

9910

SFT与RL的“终极和解”:清华大学提出LLM Post-Training(后训练) 统一理论与HPT算法

唐国梁Tommy

今天,我们要深入探讨一个大语言模型(LLM)领域的核心议题:后训练(Post-Training)。当我们谈论让一个基础模型(如Llama、Qwen)变得更强大、...

13110

给AI工程师的RL避坑指南,阿里Lite PPO如何用最少的代码,实现最强的LLM推理

唐国梁Tommy

RL4LLM(Reinforcement Learning for LLM)的初衷是好的:通过奖励信号,引导模型生成更高质量的推理过程。然而,由于LLM训练的复...

12310

LLM推理太慢?微软SambaY与“门控记忆单元”带来10倍效率革命

唐国梁Tommy

今天,我们要深入探讨一篇来自微软研究团队的重磅论文。如果你也对大语言模型(LLM)的未来充满期待,同时又对其惊人的计算成本感到忧虑,那么这篇论文绝对不容错过。它...

10410

MemAgent:当LLM学会记笔记,350万字超长文本处理难题迎刃而解

唐国梁Tommy

就在我们似乎陷入僵局时,一篇来自清华大学与字节跳动合作的论文《MemAgent: Reshaping Long-Context LLM with Multi-C...

8810

给智能体更多“思考时间”:OPPO AI Agent团队如何系统性提升LLM Agent的性能

唐国梁Tommy

LLM Agent,这个概念大家可能已经不陌生了。它就像一个拥有超级大脑(LLM)的“数字员工”,能够自主规划、调用工具(如搜索引擎、计算器、代码执行器),一步...

9910
领券