不是它"变聪明了"。是你在不知不觉中给了它足够的条件,让它在某个时刻做出了你没预期的事。
某天我说:"用户模块的数据库 schema 要加一个字段。"
WorkBuddy 的回复:
"好的。基于目前的代码结构,加这个字段会影响: 1.
models/user.py的 User 类定义 2.api/users.py的 create 和 update 两个接口的序列化 3.tests/test_user.py的 3 个测试的 fixture 我会按这个顺序改。可以开始吗?"
我还没说"帮我改"。它已经把影响范围列好了。
这不是它突然变聪明——是它"知道"了项目结构。 过去的每个文件、每次修改、每个测试,在它的上下文里构成了一个地图。加字段这个动作,在地图上的涟漪效应,它比我算得快。
我在设计新的缓存方案。让 WorkBuddy 给我建议。
它的回复:
"你上个月试过 Redis 做主存储的方案,结论是数据一致性风险太高(记录在 2026-04 的事故日志)。当前这个新方案里,有一部分逻辑和那次一样——把缓存当主存储用。建议先重新确认:这次场景的数据一致性要求,和上次有没有本质区别?"
我愣住了。我自己都快忘了那个决策。 但它在帮我记——而且不只是"记得",是把旧决策和当前方案做了交叉比对。
我在做消息通知模块。给了两个方案让 WorkBuddy 选:方案 A 用轮询,方案 B 用 WebSocket。
它说:
"两个方案都有道理。但如果你的场景是'用户不需要实时收到通知,只需要下次刷新时看到'——其实有方案 C:把通知写进一个 unread_count,前端每次请求时在 header 里返回这个数字。不需要轮询,也不需要 WebSocket。你觉得这个场景对吗?"
它不是在我给的框架里选。它跳出了我画的框。
这个惊喜的底层条件:它"知道"我的场景约束——"用户不需要实时"这个信息是我在更早的对话里随口提的。它不是"没听见"那种随意信息,它存下来了,在这个场景下复用了。
某天我连续让它改了五六轮同一段代码,每轮都在微调。我说:"再改一下返回值结构。"
它说:
"我注意到这个函数在过去 30 分钟内改了 6 次。每次改的都是同一个返回值结构。要不要先停下来,确定一个稳定的结构定义,然后再让我按定义重写?不然再改两轮你会更烦,而问题不在代码——在结构的定义还没定。"
它不是"好的"——它在我急躁的时候给了我一个冷静的建议。不是"你不能这样",是"我看到了一个模式,这个模式在让你更烦"。
我说:"这个接口的响应时间我希望它'舒服'。"
"舒服"不是技术词汇。我以为 WorkBuddy 会追问"你指的舒服是多少毫秒"。
它说:
"你之前提到过,用户列表页的响应 800ms 你觉得可以接受,但搜索页超过 300ms 就觉得卡。这个接口用在哪?如果是列表类页面,我以 800ms 为基准设计;如果是交互式搜索,300ms。"
它把我的"舒服"翻译成了我自己的历史数据——我之前在不同场景下说过的数字。
这不是"理解自然语言"——这是"理解你"。它知道你说的"舒服"在不同场景下有不同的含义,因为它有你之前在不同场景下的反馈。
这些惊喜不是魔法。每一个都需要三个条件:
条件 | 说明 |
|---|---|
连续性 | 它知道你的项目历史、决策记录、编码偏好 |
双向信息流 | 不只是你说它做——它也能记录、回溯、关联 |
允许它主动 | 你没禁止它"在你没要求的情况下说话" |
大多数人的 WorkBuddy 没有惊喜时刻,不是因为模型不行——是因为前两个条件没建好,第三个条件被默认关闭了。
追求"让 WorkBuddy 给我惊喜"是错的——惊喜不是设计出来的,是涌现的。
你做的是:建记忆系统、记决策记录、给它上下文、允许它主动发言。
惊喜是这些基础设施成熟后的自然产物。不是你要求它给你惊喜——是它终于有了足够的信息来做一个你没想到的关联。
它们很少。一个月可能只有两三次。
但每次发生,都值得花 10 秒说一句话:
"这个提醒很关键,谢谢。"
不是因为礼貌。是因为这句话在告诉它:你在我没要求时提供的信息——是有价值的。
下次它才会继续。
本文基于与 WorkBuddy 的协作经验撰写。WorkBuddy 有没有做过让你愣住的事?评论区分享你的惊喜时刻。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。