首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >当有人讲「你这个产品只是拿大模型套个壳」,没必要恼,你确实是,我们都是,包括所有人在内

当有人讲「你这个产品只是拿大模型套个壳」,没必要恼,你确实是,我们都是,包括所有人在内

作者头像
用户4889499
发布2025-10-11 12:23:47
发布2025-10-11 12:23:47
440
举报

一个 Chrome 的壳子,卖了 6 亿美金,一个 VSCode 的壳子,估值 100 亿美金,当有人说你的产品只是一个大模型套个壳子的时候,有什么可恼的呢?(Dia & Cursor)

为了把生信这个垂类(更具体的来讲仅仅是蛋白和菌种设计)的「壳子」做好,按时间排序我们分别尝试了 smolagents、langgraph 一直到 Claude Code,一路走下来尝试了很多努力了很多,却发现总也逃不出 Rich Sutton 的这堂课:《The Bitter Lesson》(http://www.incompleteideas.net/IncIdeas/BitterLesson.html):要相信通用计算的力量,要信仰通用计算的力量!相信这一波 AI 赋能的本质是「通用领域能力溢出到垂直领域」,而不是垂直领域手艺 + AI 能力放大器,没有什么放大不放大,灰犀牛来了只能引导 or 被踩死,无法重塑。所有做 AI 的董、总、VP们、尊敬的各位领导和来宾,把 《The Bitter Lesson》打印出来吧,贴在显示器边上或者直接贴脑门上!因为它确实能帮你少走弯路,减少投入聚焦在主业上,而降本增效的聚焦,正是当下这个环境最最最需要的。

一年前某大佬说我们将会需要很多 Prompt Engineer,且不管大佬是不是 lao 了,所有人确实自愿不自愿的开始尝试写 Prompt,而离 LLM 最近的码农圈,玩儿的自然要更花一些,vs-code 套个壳子就有了 Cursor,写个 Prompt 一定要到 IDE 里面写,模式嘛肯定要选个 chat 还是 agent,自定义的 rules ?那必须也得来一点,不自己改改,怎么拿出去商业互捧呢对不。

至于 Devin 唱罢,Claude Code 登场,则是常识回归的胜利,从技术路线上是顺应了上面 Sutton 老师的话,去掉了我们人类自以为是的花拳绣腿,专注于这三件事:

  1. 讲清楚要干啥?
  2. 有什么工具可以用?
  3. 已经做过的尝试和得到的结果是什么?

讲清楚这三个问题然后等着就好,不要想着告诉 ta 怎么做,不要想着告诉 ta 怎么做,不要想着告诉 ta 怎么做,重要的事情说三遍。

摆正我们自己的位置很重要,摆正之后就老老实实把上面要求的三点弄明白、写清楚、管起来,这就是所谓 context programming。

不要被这俩词吓到,context 是什么鬼?不仅要 context,还要 programming?一个鬼就够了怎么又来一个?其实背后就记住一个常识就好:之所以我们要提出来 context programing, 是因为当前运行的大模型 LLM,无一例外的,都是所有权重被冻住的 LLM。

只要看过一点点神经网络的原理就明白,训练的时候一个问题走进去,一个答案吐出来,跟标准答案对比之后还会再一个反馈给回去,给回去做啥?通过后向算法更新权重(有喜欢抬杠的同学此处要举手了,无监督训练就没有标准答案了啊!是真的吗?你给的一堆序列数据,下一个 token 难道不就是一个「标准答案」吗?)。

我们「套壳」用的 LLM,全部都是一个问题走进去,一个答案吐出来,到此结束打完收工。有人可能要问,那我要问的下一个问题跟上一个问题有关联咋办?简单!跟上一个问题和对应打答案一起给过去啊!这么简单粗暴吗?对!就是这么简单粗暴!因为你用的 LLM 的权重是冻住的还记得不?你问的上一个问题和答案并没有办法回到 LLM 的已有权重,所以只能如此,不是技术上实现不了,是工程上无法为每一个人每一个 request 都保存一遍所有更新过的 LLM 权重...

LLM 的权重没法针对每个人更新,但你的「聊天记录」可以,发出第二个问题之前,如何组织第一个问题和第一个问题的答案是可以改的对不?比如你的第一个问题是:亲,在吗?大模型回复说:这不废话!然后你第二个问题是:「谷氨酸棒杆菌生成血红素时的葡萄糖吸收速率是什么范围?」,这时候第一个问题的问题和答案+第二个问题,就构成了一个 context,一个优秀的 context 管理者这时候要做的应该是直接把第一个问题删掉,而一个卓越的 context 管理者应该不仅删掉第一个问题,还要把第二个问题已知的背景补充上,方便 LLM 进行「思考」生成答案,以上这个过程,这个去掉废话加上实话的过程,就叫 Context Programming

从我们的项目经历来看,无论是 smolagents 里面,CodeAgent 自己拆问题(Thought)、写代码(Code)、反思(Observe);还是 langgraph 里面引入 graph 和 human-in-the-loop 的概念来优化(或者说固话)流程;一直到 Claude Code 这里,明确的就是一个大 loop(一个精心设计的主 Prompt),里面装了 16 个精心设计、明确说明的 tools(今天的版本可能已经加到了 20 个 tools),Claude Code 通过简单有力的设计,把针对用户的问题,筛选什么信息应该放到 context,什么信息应该踢出 context 这件事情解决的干净利索,回归这个问题的常识解法,这就是它强大的唯二原因(另一个当然是 Claude LLM 这货确实强)。

有了上面这个认识,我们就明确了该聚焦的点:专注于自身领域的思考,找到属于自己的问题,找到这个问题当前的研究背景,聪明的组织这个问题和背景,然后老老实实交给 LLM,坐等答案。看起来我们好像让渡了部分「思考的权利」,但请记住,当前阶段的 LLM 权重都是冻住的,即便是退一万步讲,ta 思考的比你深、比你远、比你好,思考的结果也是贡献给你了,你拿到这个结果进一步成长蜕变,进步的是你,至于 LLM,还是那些权重并没有什么改动。

以上,就是这小半年来的感触,context programing 也好 vibe programming 也好,prompt programming 也好,本质上都是你和你的工具充当大模型的 context,充当大模型的「壳子」,来套取大模型的知识和洞见的过程,我们去年培训的三句话,第二句就是面对 LLM,要偷不要抄,我们要聪明的理解并内化 LLM 给出的知识,偷到自己脑子里并体现在下一次 context 设计里面,不要抄,一定要过脑子变成「偷」,一味的抄跟被冻住的 LLM 一样,没办法更新自己的权重。

我们要做的,是回归常识好好利用自己的领域知识设计 context,设计 context 就是设计「壳子」,context programing 就是套壳大法,这个壳子这个 context,不仅仅是你设计的程序,还包括你自己本身,以后有再有谁说你:「你这个产品只是拿大模型套个壳子」,这哥们要么没整明白未来我们都是 context programmer,都是做壳子的人,都是壳子的一部分;要么就是你的程序+这哥们 == 不好用的壳子。

不好用,可能是你程序的问题,也可能是你这个哥们的问题。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI 生物设计 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档