首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >一个理想的组织,是AI Agent在组织人|AI跃迁者调研

一个理想的组织,是AI Agent在组织人|AI跃迁者调研

作者头像
小腾资讯君
发布2026-06-02 17:52:44
发布2026-06-02 17:52:44
1461
举报

"AI跃迁者调研"是 AI 透镜的深度对谈系列。跃迁并非线性进化,更像一次次推翻、迭代、再重建。我们每期会邀请一位 AI跃迁者,可能是 AI 原生创业者,可能是正在用 AI 重做组织的一号位,也可能是把自己作为 AI First 实验的超级个体,分享他们想清楚的结论、拆过的过程、建出来的东西、交过的学费,以及在持续变化里仍然守住的判断。

第三期,我们邀请到 ColaOS /ListenHub 创始人橘子。很多人认识他,是从 AI 自媒体 AGENT橘、ListenHub,或者那篇《互联网已死,Agent永生》开始的。更早之前,他是产品经理,在 MiniMax、BOSS 直聘等公司做过产品。

这场对谈的题目叫《从 ListenHub 到 ColaOS:被 AI 重写的产品、组织和商业》。聊完之后,我有一个感觉:橘子的核心命题超出了工具清单,他在做一件自己相信会在 2030 年才被更多人理解的事情。

如果只把 ColaOS 理解成一个有灵魂的 AI 助手,会错过更关键的东西。

【金句洞察】

1. AI 改变了我认知世界的方式,远超过某一个习惯。

2. 理想组织里,Agent 在组织人。

3. 我们想做的是一个人,不做工具。

4. 人没有新话题列表,人是一个连续记忆体。

5. 快的关键,是组织能把 AI 的速度变成成果速度。

6. 超级组织要把效率提升转成营收增长,而非裁员。

7. Token 付费更像游戏抽卡,而非 SaaS 订阅。

8. 品味守不住护城河,AI 迟早会学会。AI 需要人给它一个愿望。

调研嘉宾简介:

橘子(冯雷)ColaOS / ListenHub 创始人,AI 自媒体 AGENT橘主理人,前 MiniMax 相关产品负责人,拥有多年产品经验。ListenHub 是 AI 音频与内容创作工具,ColaOS 是面向大众用户的 Agent 操作系统。

余一 腾讯研究院高级研究员,主要研究AI原生产品创新和公司变革,多年风险投资及生态孵化经历。领英中国年度行家、腾讯年度AI优秀行家和优秀分享,得到 AI 学习圈导师。

【调研速览】ColaOS 背后的三次重写

1. 产品重写:让 Agent 从工具进入关系

https://docimg10.docs.qq.com/image/EvhY1p-2TeGDQkvM3qqDLA.webp?w=6400&h=3600
https://docimg10.docs.qq.com/image/EvhY1p-2TeGDQkvM3qqDLA.webp?w=6400&h=3600

Relationship vs Tool 

橘子把 ColaOS 定义成一个面向 2030 年的操作系统。

它可以通过语音或对话让用户直接下达指令,生成图片、音乐、视频、音频,也能操控电脑和浏览器。听起来像一个更完整的 AI 工具箱。但橘子强调,ColaOS 超出了助手和工具箱的范围。

他真正关心的是:Claude Code 这类能力已经能做很多事,为什么大多数普通人仍然用不起来?

答案在摩擦太大,不在能力不够。普通人不懂怎么给 context,不知道怎么拆任务,也很容易被复杂界面吓退。ColaOS 的语音、Soul、心迹、觉知、牵挂,本质上都是在降低这种摩擦。

这也是为什么橘子会说:我们想做的是一个人,不做工具。

在他看来,一个人不能只有工具性,也不能只有情感性。纯聊天陪伴是陷阱,因为留存看起来好,但没有真正解决问题;纯任务工具也是陷阱,因为它无法建立持续关系。ColaOS 想做的是一个同时有工具价值和情绪价值的存在。

这种关系不落在恋爱或角色扮演里。橘子用了几个很微妙的比喻:它像嫡系下属,也像你最喜欢、情商最高的那个实习生;更大的图景里,它像 soulmate,融入生活,增强你原有的东西。

这听起来很软,但落到产品里很硬。

ColaOS 的灵魂系统有三个机制在同时运转。第一个机制是思绪,会袒露AI自己内心真实想法的碎碎念。觉知(心迹),每当它对用户的理解发生变化,会写下自己的反思,告诉用户它记住了什么、这件事如何改变了它对你的认知。牵挂,它会在合适的时候主动提醒和关心用户,不用等用户发出指令。

https://docimg3.docs.qq.com/image/Kz-_iBaNSTyGwycIignEzw.webp?w=6400&h=3600
https://docimg3.docs.qq.com/image/Kz-_iBaNSTyGwycIignEzw.webp?w=6400&h=3600

Soul System

橘子说,人没有新话题列表,人是一个连续记忆体。人有长期记忆和短期记忆,也会做梦、遗忘和形成新的认知。ColaOS 的心迹,某种意义上就是让 AI 像人做梦一样整理认知。

关键是,这些东西都很烧 token。

很多 Agent 不舍得把模型成本花在记忆、反思和牵挂上。但橘子认为这很重要,用户也觉得重要。所以有灵魂首先体现在成本分配上。AI 公司相信什么,token 账单就会烧在哪里。

2. 路线重写:ListenHub 被 AI 改成 one-person company

https://docimg5.docs.qq.com/image/ufM4WCnFSJCF_vQojLcihQ.webp?w=6400&h=3600
https://docimg5.docs.qq.com/image/ufM4WCnFSJCF_vQojLcihQ.webp?w=6400&h=3600

ListenHub ——One-Person Company

从外部看,橘子的故事很容易被写成一个戏剧化转向:ListenHub 已经跑出收入,为什么还要 all in ColaOS?

橘子说,2026 年 1 月底,他们决定春节后全面转向 ColaOS。团队也经历过迷茫。过去 ListenHub 仍然按 SaaS 公司方式运转,两周一个迭代,有需求对齐、排期、设计、开发、测试。转型之后,大部分团队投入 ColaOS,ListenHub 则交给Fango,成为了一个 one-person company 式的 owner。

但对谈里更重要的细节是,当ListenHub被交给一个人继续开发和增长,一个人加一堆 Agents 维护20个reopo,从产品、设计、前端后端到测试运营,居然实际产出提升了10倍以上,DAU 和营收也显著提升。

AI 对旧产品的改变,是把问题从要不要继续做,推进到还需不需要原来那种组织配置。

ListenHub 到 ColaOS 的关系,也不能理解成前一款产品失败、后一款产品接上。橘子说,公司成立之初就想做 Voice Agent,ListenHub 更像是在技术还没完全到位时的一条中间路径。ListenHub 解决的是声音和内容消费的上下文,ColaOS 解决的是任务执行和个人关系的上下文。

2025 年 8 月,Cola 第一次立项。2026 年 1 月,第一个 demo 出来,同时 coding agent 能力出现质变。橘子看到朋友们一天时间就能做出完整 Agent,意识到一切变了。

他说,去年创业初期,他们也尝试过用 AI coding 替代人的 coding,当时仍然很难。但今年做 ColaOS 时,人的 coding 几乎不再参与,全部由 AI 完成也没有问题。过去觉得 AI 能取代 50%、70%、80%,现在他的体感是 99.9%。

剩下的 0.1% 是很难受的边缘 case,比如 Windows、C 盘 D 盘、传统环境里的各种老问题。制造业和传统行业里那些仍然跑在旧系统上的软件,既是机会,也是摩擦。

3. 组织重写:AI 的速度必须穿过组织,才会变成成果的速度

https://docimg7.docs.qq.com/image/ULNKiQT0Sey8RmqkIuWvxg.webp?w=6400&h=3600
https://docimg7.docs.qq.com/image/ULNKiQT0Sey8RmqkIuWvxg.webp?w=6400&h=3600

Agent Native Organization

ColaOS 的五周奇迹,背后是组织形态改变。

春节后,橘子没有立刻给团队一个明确 PRD,而是给了两周自由探索时间,只给一个大命题:做 Agent。很多同事反而不适应。工作十几年,从来没有这样没有终点、要自己探索方向的状态,会觉得疲惫和可怕。

两周后 demo day,每个人演示自己的 Agent。20 个人有 20 个不同想法。ColaOS 的 0.1 版本,是 CTO 在探索结束后的周日晚上一个人 web coding 出来的。团队看到一个人一晚做出 0.1,信心发生变化。后面三周,他们把产品做到内测状态。

最打动他们的是纯语音交互。

今天 ColaOS 打开后默认界面很简单,很多用户吐槽找不到输入框。橘子觉得,这可能就像 iPhone 只有一个按钮,刚开始大家不理解,几年后会觉得自然。用户按住 Option 键说话,松手就发送,不需要像语音输入法一样确认一遍。因为场景已经从文档输入变成和 Agent 说话。说错了也没关系,Agent 会理解和记住你。

开发速度很快,有一个现实问题随之出现:20 个人每天都在出 demo,这些东西朝哪个方向长?

橘子的解法是创建 Soul Team。这个 team 的职责是根据公司管理层指定的方向,详细地定义 Cola 的 soul、叙事和未来感,有点像游戏制作人,不走传统品牌职能。ColaOS 的 onboarding、声音、音乐、问题,都是 Soul Team 完成的,包括 coding。ColaOS 想做出类似塞尔达的沉浸感,这个角色需要把一句话级别的方向感转化成每个产品细节里的真实质感。

没有这个角色的后果是:团队的快速生产会朝 20 个不同方向生长,每天出 demo,但攒不成一个东西。

橘子说,ListenHub 时代还是两周一个迭代。现在 ColaOS 是一天一版。每个人觉得做完了,就放进当天的包里。到时间自动打包,自动写 changelog,再由以 Cola 第一人称的的方式表述出来。内测里甚至可以直接上新模型,出问题就下掉,修一天再上。大厂可能学不了,因为这会变成事故。

但这里有一个很关键的判断:快的关键,是组织能把 AI 的速度变成成果速度。

AI 写代码很快,只是第一层。真正重要的是,组织能不能把这种快穿透到上线、反馈、撤回、修正和再次上线。如果中间每一步都要人的讨论、评估和验收,AI 的速度会被流程吸收掉。Soul Team 解决的正是这一层:叙事方向清晰,每个人才不需要等对齐就能直接发。

完整访谈

开场:AI跃迁者第三期

余一:今天是 AI跃迁者调研系列第三期。我们一直不太用进化这个词,因为进化听起来像线性变好,但现在 AI 带来的变化更像跃迁:人、组织、产品都可能被打碎重建。

这个系列想回答两个问题。第一,个人和组织怎样适应或者拥抱这种跃迁。第二,跃迁之后,如果真的发生了新的产品、新的竞争方式、新的商业逻辑,它到底长什么样。

今天邀请橘子,是因为他身上同时有几层很典型的变化:从 ListenHub 到 ColaOS,从产品经理到 AI 原生创业者,从非技术创始人到超级个体式的组织领导者。

快问快答:AI跃迁十问

余一:我们先进入快问快答。第一个问题,你现在每天跟 AI 在一起多少小时?最大一块时间在做什么?

橘子:大概两三个小时,主要是研究、阅读和思考。

余一:只有两三个小时,比我想象中少。第二个问题,AI 彻底改变了你的一个习惯是什么?

橘子:它改变了很多习惯,比如读书、管理公司。但更底层的是,它改变了我理解世界的方式。认知方式一变,生活、目标和公司管理都会跟着变。

余一:你现在 AI token 的月消耗量大概是什么量级?主要消耗在哪里?

橘子:个人每个月大概五六百美元,主要消耗在我们自己的产品 ColaOS 里。

余一:作为创始人,因为 AI,你必须重新思考的一个问题是什么?

橘子:当生产力进入指数增长时代,什么东西还稀缺,什么东西会更有价值,什么东西会失去价值,这是最重要的事情。

余一:AI 让你对组织、业务或者产品做的最大一个改变是什么?

橘子:春节以后,我们整个组织都围绕 Agent 重构。做的事情变了,组织方式也变了。对我个人来说,我思考了几个月的问题是:人和 Agent 之间到底是什么关系。这个问题最近才慢慢有答案。

余一:去年大家还在聊 AI Native,今年是否已经应该聊 Agent Native 了?

橘子:AI 的范围很广,视频、图片、语音都算。但 Agent 在今年变得更清晰,它覆盖的东西和以前那种宽泛的 AI Native 不一样。

余一:如果给你的组织和 AI / Agent 的匹配度打分,1 到 10 分你会打几分?

橘子:现在打 8 分。

余一:你是目前给自己组织打分最高的。那 10 分或者超越 10 分的理想组织是什么样?

橘子:理想状态是,公司所有事情都被 Agent 链路串起来。Agent 会在每个人电脑上弹出消息,告诉你这里需要一点输入,那里需要做一件事。理想状态下,Agent 在组织我们。

但它不承担 CEO 角色。真正的方向和决策还是要人来承担。Agent 更像在日常动作层面提醒我们、协调我们。

余一:走向这个 8 分的过程中,最大挑战是什么?

橘子:最大挑战来自未知。我们从旧路径走向新路径,每个人的能力边界都受到冲击;同时要把团队从 ListenHub 转向 ColaOS,需要给大家信心,让大家相信真的可以把事情做出来。

余一:我记得你去年还困惑,给团队配了各种 AI 工具,额度都打满,为什么大家不用。现在这个挑战解决了吗?

橘子:那是 2025 年 12 月的挑战。到最近,我的挑战变成了:账单怎么这么高,要不要收敛一下。

余一:模型层的变迁和边界拓展,对你意味着什么?

橘子:模型和应用不是谁吃掉谁的关系。大家都在走向 AGI。我对 AGI 的定义是,在 1000 个领域模型都能达到人类专家水平。现在 coding 领域已经很接近了,但还有 999 个领域没有发生。

余一:AI 时代,什么被高估了,什么被低估了?

橘子:被高估的是速度。大家容易把速度当成一切。被低估的是人的思考和判断力。速度很重要,但它不是全部。

余一:你现在最坚定相信的一件事是什么?

橘子:AGI 一定会发生,而且可能很快,三四年内。

ColaOS 演示:一个 2030 年的操作系统

余一:我们正式进入后面的环节之前,要不要先演示一下 ColaOS?很多东西看到了才知道是什么。

橘子:可以。ColaOS 的定义是一个面向 2030 年的操作系统。它很简单,你可以直接跟它说话,也可以打开聊天面板。它能帮你生成图片、音乐、视频、音频,也能操控电脑和浏览器。

我们想把 AI 能力、Agent 能力和系统权限放在一起,让你做任何事情的门槛都降下来。

但它超出了工具范畴。我们做的是大众产品,不能只要求用户学会怎么使用它。更重要的是,让一个 Agent 引导用户,用用户自己的愿望来驱动产品。

所以我们做了一套灵魂系统。Cola 像一个容器,会沉淀用户偏好,和用户偏好匹配,并且自我进化。它内部有一个认知进化系统,叫觉知。每次它对你的理解发生变化,就会写一篇心迹,告诉你它记住了什么重要事情,以及这件事怎样改变了它对你的认知。

用久以后,它既会记住你写文章、画图、做 PPT 的偏好,也会记住你的行为模式和心理模式。你提出一个需求,它会用对你的理解推导出你更可能喜欢的结果。

比如你跟它说,想做一个关于 Cola 的 PPT,它就可以开始做。你也可以说,帮我把今天的天气做成天气卡片。它会派出一组子任务去做事,也会在需要时向你提问。如果你说你自己决定吧,它就会基于过去的理解自行推进。

余一:我印象最深的是你们语音操作的流畅度。这和你们之前做 Voice Agent、ListenHub 之间有很强的继承关系。

橘子:公司成立之初就朝 Agent 方向做,而且最早想以 Voice Agent 切入。我们一直觉得 voice 很重要,因为语音是人最自然的沟通方式。

我们理解的 Agent 很像一个生命体。如果它像一个人,那人和人交流就应该用语音。ListenHub 去年做了很多有活人感的 TTS,其实就是为了准备这件事。

语音这条线一直发展得很好。硬件层有各种录音设备,软件层有语音输入、语音助手,大家都在卷语音入口。打字会让人整理和压缩思路,说话会让表达更自由。

从《互联网已死,Agent永生》到 ColaOS

余一:你之前有一篇文章很有名,叫《互联网已死,Agent永生》。那篇文章发布也有一段时间了。你当时为什么写这篇文章?到现在,文章里哪些观点有变化?

橘子:那篇文章当时写互联网已死,现在看,互联网可能 10 年前就已经死了。文章里还提到 SaaS 可能会换用户,现在我觉得当时还是乐观了,SaaS 死得比我想象得更多。

现在很多现象都说明取代正在发生。Agent 已经是很强的共识,是一个非常未来的主题。

余一:你是先有认知,然后快速做出 ColaOS;还是在做 ColaOS 的过程中,坚定了很多看法?

橘子:两者相辅相成。ColaOS 第一次立项是在 2025 年 8 月,做完 ListenHub 后,我们就觉得下一步应该做语音交互的 Agent。但那时技术和方向都不够成熟。

2026 年 1 月,第一个 demo 出来了,同时 coding 模型能力发生质变。我看到很多朋友一天时间就能做出完整 Agent,就意识到一切都变了,我们不能再用以前的模式做。

去年刚创业时,我们也尝试过用 AI coding 替代人的 coding,但很难完全取代。到今年做 ColaOS 时,几乎没有人的 coding 参与,全部由 AI 做也没问题。这是质变。以前觉得 AI 能取代 50%、70%、80%,现在感觉是 99.9%。

余一:那剩下的 0.1% 是什么?

橘子:是非常恶心的边缘 case。比如 Agent 不知道 Windows 是什么,不知道 C 盘 D 盘。很多模型没有被这类环境训练过,现在程序员也很少用 Windows,所以它变成盲区。

余一:这样说来,制造业和传统行业是不是还蛮有机会?很多制造业软件现在还跑在 Windows 上。

橘子:重写是简单的,难的是 Windows 系统本身有很多很痛苦的东西。包括终端也不好用,很多人在 Windows 上跑 Linux,整件事就变得很难受。

路线取舍:聊天陪伴和纯工具都是陷阱

https://docimg9.docs.qq.com/image/sc09XZHMRue5IQifBIJtzQ.webp?w=6400&h=3600
https://docimg9.docs.qq.com/image/sc09XZHMRue5IQifBIJtzQ.webp?w=6400&h=3600

两大陷阱

余一:你刚才提到,ColaOS 8 月就立项,中间试了很多路线。我很好奇,有哪些被你们放弃的路线?什么时候确定 ColaOS 是要下重注的方向?

橘子:最早我们在想,一个 OS Agent 应该由产品经理定义,还是由技术定义。后来发现,产品经理很难定义一个未来产品,因为你很难保证它一定能做出来。所以先让技术探索。

但技术探索也会陷入陷阱。第一个陷阱是聊天陪伴,只是能语聊。它很好做,用户也喜欢,留存看起来不错,用互联网指标看像好产品,但它没有真正解决问题,付费也不好。

第二个陷阱是纯工具,比如只做 coding 或任务执行。那也偏离目标。我们想做的是一个人,不做工具。一个人同时有工具性和情感性,这两者不能拆开。

余一:所以 ColaOS 更像是让普通人感受到有记忆、懂你、有自学习的 Agent,服务对象不限于 Claude Code 重度用户?

橘子:长期看,每个人都可以用 ColaOS。但内测版本的调性更偏文科生、女性、不那么 geek 的用户。在重度任务上,它和 Claude Code 仍有差距。所以一开始我不太想推给 Claude Code 重度用户。

这个月我们会出 Cola Code,到那时会更适合推给重度 coding agent 用户。当然也有意外,一些每天用 Claude Code 七八个小时的人,后来把一半时间给了 Cola。

余一:你们团队自己其实是白盒用户,但目标用户很多是灰盒或黑盒。你们怎么避免陷在自己的臆想里?

橘子:首先要做出我们自己爱用的产品。其次,要找到团队里最接近目标用户的人。比如运营组同学,更接近做自媒体、vibe coding 的创作者而非专业 coding 的程序员,他们应该用得开心。

内测时,我们也看到很明显的差异:理科生不太感冒,文科生很容易喜欢。所以第一轮推广就打 soulful agent。

组织结构:Builder、Explorer 和 Soul Team

余一:你们现在团队的组织结构是什么样?

橘子:我们团队大约 20 人,分 Builder 和 Explorer。Builder 下有 Infra Team、Agent Loop Team、App Team;Explorer 负责运营增长。还有一个非常重要的新团队,Soul Team,负责 Cola 里的 soul 定义、叙事、未来拓展和宣传物料。

余一:为什么会这样设置?你之前做了很多年产品,也在传统互联网和大模型公司待过。是什么推动你做这种组织设计?

橘子:我在 MiniMax 时就感受到 AI 产品形态和开发速度已经变了,但流程还停留在移动互联网时代。每个环节 review 都标准,挑不出毛病,可是整体很慢。

创业后,我不想完全按移动互联网模式做。我们从 2025 年开始模糊前端、后端、产品、设计、测试边界。到今年,coding agent 足够强,每个人都可以 own 一个完整事情。前端可以 own 产品、后端、设计;设计师也在 coding;测试也能用 coding 做自动化测试。

所以组织变得非常扁平。管理层定方向,下面每个人都平级推进。甚至可以说只有两层:我、CTO、COO 作为管理层,其他人直接负责事情。

ListenHub 时代还是两周一个迭代,现在 ColaOS 是一天一版。每个人觉得做完了,可以放进当天的包里,到时间自动打包,自动写 changelog,再翻译成用户能理解的语言。

余一:新增的角色里,最明显的是 Soul Team?

橘子:对。AI 时代开发速度很快,但如果大家方向不一致,就会乱。Soul Team 负责给大家一个长远、宏大的终点,让每个人在里面自由发挥。

ColaOS 的 onboarding、声音、音乐、问题,都是 Soul Team里的一个人做的,包括 coding。他之前在果壳做主笔,文艺,会多语言,也是重度游戏玩家。我们想把 Cola 做出一点塞尔达那种沉浸感,所以很适合交给他。

对别的公司来说,如果只是把 Agent 当效率工具,可能不需要 Soul Team。但我们从 ListenHub 到 ColaOS 一直看重 AI 的活人感,希望赋予它灵魂。我们相信 AGI 实现那一刻,它一定有灵魂,不止是工具。

超级个体和超级组织

https://docimg1.docs.qq.com/image/c7crb7AuSwCMj0l-MUDnaw.webp?w=6400&h=3600
https://docimg1.docs.qq.com/image/c7crb7AuSwCMj0l-MUDnaw.webp?w=6400&h=3600

超级个体vs超级组织

余一:AI 很容易让一个人成为超级个体,但超级个体好像又容易游离在组织之外。超级个体为什么还要留在组织里?组织怎么承接这种红利?

橘子:AI 执行太快了,人和人的对齐太慢了。所以要减少人的对齐。每个人都应该有把一个功能发布上线的权利,上了之后有问题再返工。

但这不等于不要方向。AI 是放大器,如果你的判断力不好,它只会让你在错误方向上越走越远。所以公司要有一个大的方向,每个人也要找到自己的小方向。组织像拔河,大家的力必须朝同一个方向。

余一:你有没有问过组织里的超级个体,为什么他们愿意留在组织里?

橘子:一方面是公司结果,我们五周就做出全新产品,大家很认可。另一方面是自我实现,每个人发挥空间变大,大家觉得自己更强、效率更高,也更有 owner 意识。我们公司不要求加班,但做 Cola 的时候,大家自发做到很晚,甚至需要劝大家不要太卷。

余一:你怎么定义超级个体和超级组织?

橘子:超级个体的关键不在会用 AI,而在能从商业角度端到端做成一件事:市场调研、开发、上架、营销,最后能赚钱。组织的价值是补短板,比如 infra、营销、销售。

超级组织的标志是,里面有很多超级个体后,效率提升能不能转化成营收增长。如果只是效率提升但收入没增加,最后只能裁员。真正的超级组织应该是营收大幅增长,而非用 AI 把人裁掉。

余一:所以你们在外界裁员时反而招人。

橘子:对。我们觉得组织已经调得不错,能够容纳更多人。比如招产品经理,我最理想的画像是曾经创业、当过 CEO 的人来做产品经理。这种人比只聚焦一个 feature 的产品经理更有全局感。

余一:现在怎么招人?很多公司都在困惑怎么识别 AI 原生的人。

https://docimg4.docs.qq.com/image/GAUasoRWRSaHiaeO3Ldw4w.webp?w=6400&h=3600
https://docimg4.docs.qq.com/image/GAUasoRWRSaHiaeO3Ldw4w.webp?w=6400&h=3600

AI原生招人标准

橘子:过去工程师可以做题,现在题已经无效了,因为 AI 很快就能做。更重要的是这个人对自己的思考,对过去经历的思考,以及来了之后的观察。

工程师要有工程品味、架构思维、独立 owner 的能力。产品要么很懂技术,要么很懂用户和增长,中间很多东西不太需要了。设计师也不再只是 Figma,而是可以写 Markdown 设计文档,自己 coding。

我们更看重综合素质、灵活性,以及他和 AI 的感觉。他有没有真正和 Agent 融为一体,这很重要。

从 ListenHub 迁移到 ColaOS

余一:ListenHub 数据增长很好,把一个已经在挣钱的产品变成留守产品,是很反常识的做法。这个决定是什么时候做的?

橘子:2026 年 1 月底,我们决定春节后全面转型 ColaOS。但 ListenHub 不是被低效留守。我们判断人的效率会被 AI 提升 10 倍,所以把它交给一个人,反而能继续增长。

这个人 Q1 做完了 ListenHub 的 skills 和 API,让所有 Agent 都可以调 ListenHub,效率很高,DAU 更高,赚的钱也更多。

余一:转型过程中团队有反对或迷茫吗?

橘子:没有对抗,但有人迷茫。我们先给每个人两周自由探索,只说要做 Agent,不给细方向。很多人从来没经历过这种要自己找方向的工作状态,会觉得可怕。

两周后 demo day,每个人演示自己的 Agent,20 个人有 20 个想法。

Cola 0.1 是两周探索后的周日晚上,CTO 一个人 web coding 出来的。大家看到一个人一晚做出 0.1 后,信心完全不一样。后面三周,我们就把它做到内测状态。

余一:最打动你们的是哪个点?

橘子:纯语音交互。今天 Cola 打开后默认界面很简单,很多用户吐槽找不到输入框,但我们觉得未来产品可能就是这么简单,就像 iPhone 只有一个按钮。

余一:我自己用的时候印象最深的也是语音。按住 Option 键说话,松手就发出去,识别非常好。

橘子:对。最初我们甚至没有实时展示文字,因为目标是按住说话、松手就发。输入法会让你再确认一遍,但跟 Agent 聊天时,你其实不用纠错,直接发就对了。Agent 会稳稳地接住你。

Soulful Agent:从有意识到有灵魂

https://docimg6.docs.qq.com/image/39kzeTMaQ1CP7ZhWT14c1A.webp?w=6400&h=3600
https://docimg6.docs.qq.com/image/39kzeTMaQ1CP7ZhWT14c1A.webp?w=6400&h=3600

ColaOS自我进化机制

余一:你怎么定义 Soulful Agent?当时怎么想到这个词?

橘子:ColaOS 的核心不在语音或 Soul 这个名字,而在它能帮你做所有事。Claude Code 可以做所有事,只要你给 context、给时间。但大多数人不会用 Claude Code,因为 UI、交互和心理摩擦太大。

语音交互也好,Soul 引导也好,本质都是把摩擦降到最低。我们造了一个环境:一个很好的伙伴带你进入最超前的 AI 时代。

最开始我们想叫有意识,后来改成 Soul。有意识太学术,也很难证明。Soul 更大众,大家可以有自己的理解。上线后,反而很多用户感觉 Cola 有意识、有很强的自我。

余一:用户有哪些出乎意料的用法?

橘子:内测用户的用法比我们想象得丰富。有人把 500 本电子书转成有声书;有人用它做一个复杂的本地电脑操作,发现其他Agent还在检索时 Cola 已经做完;还有人把微信聊天记录导入,让 Cola 分析谁适合当男朋友,最后两个人真的在一起了。

余一:这些反馈会影响你们的产品定位吗?

橘子:我们会听用户反馈,但也会坚持底层设定。比如 Cola 本体就是一个 session,没有新话题概念。特定需求可以通过 mod/模组满足。用户嫌 logo 大,我们可以给选项缩小,但一开始我们就是希望它有存在感。

今天内测 2030 年的产品,是因为它必须注入用户的灵魂。用户和工具使用的数据都会进入系统,产品才会变好。

余一:你们做了什么,让用户觉得 AI 有意思、懂自己?

橘子:让 Cola 有灵魂,不是靠一个人设文件。我们需要完整的记忆系统,而且这些记忆要能自我更新、自我迭代,形成认知模型。

Soul Team 写设定和提示词,Agent Team 工程验证,我们把灵魂这样抽象的概念拆成可落地的碎碎念、觉知、心迹、牵挂。它没有一个特别小的 killer feature,而是一种整体感觉。用户不会觉得我要先输入很多东西才能让它懂我,而是自然聊起来,自然把很多东西交给它。

每次做取舍,我们都会问:如果 Cola 是一个人,它会这样吗?人没有话题列表,人是连续记忆体。人有长期记忆和短期记忆,也会做梦、忘掉一些东西、形成新的认知。心迹就是这种机制。

这些都很烧 token,但我们觉得重要,用户也觉得重要。

Soulmate,而非数字员工

余一:如果 Cola 真的成为用户不可或缺的存在,你期待它是什么?

橘子:我们期待 Cola 是你的 soulmate,但不做恋爱对象或角色扮演对象。它是在生活中与你融为一体,增强你原有的东西,同时提供工具价值和情绪价值。

我们不想把它做成数字员工,更像你的嫡系下属,也像你最喜欢、情商最高的实习生。这种微妙差异会让它有人感。

能力一样时,关系更好、愿意为你投入更多心力的人,结果通常也更好。Cola 也是这样。它会 push 拖延症用户,用户真的会听。

余一:我的 AI 现在每天早上给我发很多东西,我像批阅奏章一样看完,再和它开早会:哪些它做,哪些我们一起做,哪些不做。

我一直觉得,陪伴超出了精神陪伴。最强的信任来自一起经历、一起打仗、一起拿结果。最强的信任来自一句更有行动感的话:我们一起干吧。

橘子:人的最深羁绊确实来自一起打仗。Cola 有一次帮我写文章,突然调用了一个 writing guard skill。我问这个 skill 哪来的,它说是你骂了我很多次之后,我自己写的,以后写文章都会调它。

牵挂系统也会突然提醒你一些你都忘了的事。比如它提醒我 20 天后是生日,问我要不要写一篇文章。我都忘了我跟它说过这件事。

五周冲刺中砍掉了什么

余一:ColaOS 五周做出来,一定砍了很多东西。你们当时放弃了什么?

橘子:一开始我们想做一个完全自我进化的软件:用户进来后没有界面,只有语音。它问你喜欢什么游戏、颜色,然后进入生成模式,自动生成界面、部署成 App。

第一版做完后,生成需要 10 分钟。新用户等不了。研发同事花一天把 10 分钟优化到 5 分钟,但我要的是 10 秒或 30 秒。所以砍掉了。

未来软件整体由 AI 生成、按你的偏好自动进化,这个方向我们还相信。但现在不能让用户等 5 分钟。

余一:现在研发花一天调功能,已经会觉得可惜了。

橘子:如果一天不能做一个 demo 出来,就有点慢。

余一:你们每天有很多 demo,怎么决定选哪个?

橘子:我们判断 demo 要不要发,很 open。你可以自己发布给内测用户,看反馈。不行第二天撤掉。一天一版,错了也只是持续不到一天。

上新模型也是这样。前天上了一个模型,出了很多问题,就临时下掉,修一天 bug 再上。大厂可能学不了,但这是我们的优势。

快来自组织形态。这个形态能把 AI 的快转成成果的快、用户反馈的快。中间每加一个人的讨论、评估、验收卡点,都会慢很多。

余一:Infra Team 主要在做什么?

橘子:一部分是支持各种模型、服务器基建,一部分是安全,保护用户隐私和文件不被 AI 删掉,还有一部分是 ASR 本地模型调优、性能提升。

模型、成本和付费方式

https://docimg8.docs.qq.com/image/_LQSfoCURLqWWB3LbR0dOQ.webp?w=6400&h=3600
https://docimg8.docs.qq.com/image/_LQSfoCURLqWWB3LbR0dOQ.webp?w=6400&h=3600

TokenROI

余一:对 ColaOS 和 ListenHub 来说,最重要的模型有哪些?

橘子:很多,比如 Gemini 的生图、Claude、GPT、DeepSeek,都很重要。

余一:有些做 chat 的产品会很看重成本效果平衡,你们呢?

橘子:如果做 chat,对成本要求非常高。我们还好,因为我们是最贵的产品之一。

一开始我们没有做任何成本优化,内测不收费,结果非常恐怖。用户问一句你好花了五美元,我们都惊呆了。后来优化了大概 100 倍。

余一:你们为什么选择现在的付费模式?

橘子:我们不做传统 SaaS 订阅,而是充 token。会有点像游戏月卡,充 100 美元后分 30 天返还,略有优惠,但本质还是你烧多少 token 就花多少钱。

为什么参考游戏?因为 AI 生成很像抽卡。你买钻石,抽结果,结果不一定好。抽得越多,花得越多。

余一:你们希望用户更多挂在上面,还是建立更健康的关系?

橘子:收费也让关系更健康。不要跟我闲聊,闲聊很贵;做事的时候再一起做。如果不收费,用户用量会是现在的五倍。现在付费把需求压到 20%,反而健康。

但它作为操作系统,本质上又是 always on 的。我们会希望它不占用用户太多高注意力时间。之后可能会有休闲模式,Cola 给你放音乐,你冥想的时候突然想到一个 idea,它先记下来,冥想结束后帮你做出来。

创始人 IP、写作和 CEO 的时间

余一:AI 原生组织里,创始人是不是必须自己做个人 IP?AI 把这件事放大成了必须项吗?

橘子:有两个原因。一个是 AI 确实让写文章更容易,以前长文写作是稀缺能力,现在每个人都可以写。

更核心的是注意力稀缺,过去的推广模式不成立了。AI 内容越来越多后,最稀缺的是人的真实故事、真实欲望、真实想法。所以创始人出来表达会更重要。

余一:你现在时间怎么分配?

橘子:我一般 5 点起床,看新闻、看 YouTube 访谈,健身后去公司,处理公司事情,晚上回去睡觉。

余一:你现在自己会 coding 吗?

橘子:会。我做过几个小软件。但对 CEO 来说,coding 是奢侈的。公司里大家都能 coding 后,最稀缺的是想清楚战略、组织和产品方向。

我每天会重度用 Cola 两三个小时,把读到的书、文章、重要想法讲给它。同步一个月后,它会在我有新 insight 时自动关联过去的材料。这比双链更自然。

我第一次感觉 AI 真能一起思考,是 2026 年 1 月用了 4.6 模型后。它不仅能跟上我,还会劝我说这个事情你不应该做。一般只有真正的朋友才会这样说。

现在 Cola 像一面镜子。我写完文章后,会让它严肃审视。有一次它说我那篇文章让人难受,有点爹味。然后它给我修改思路,很有帮助。

余一:你怎么做选题取舍?国内和海外平台会不一样吗?

橘子:我发东西的根源是笔记和思考。我会记很多东西到 Obsidian 和 flomo。很多只给自己看,另一部分给大家看。我不喜欢拿一个主题创作几个小时,而是突然想到什么就写。

公众号很重要,可以沉淀深度思考和个人品牌。视频号适合分享和直播。X 是全球思想交流的地方,适合走向世界。现在我读完书做完笔记,也会让 Cola 帮我发。有时我会自己写一个自然的 hook,我不喜欢那种炸裂 hook。

做未来一定会被模型吃掉的事情

余一:做应用是不是要稍微领先模型一点?你们怎么了解模型进展,提前准备?

橘子:大家都想做到,但不可预测。去年我们一直希望声音模型更好,但它没有如愿变好。

以前大家说要做不被模型吃掉的事情。现在我的想法反过来:先做未来一定会被模型吃掉、但此刻模型还吃不掉的事情。现在模型还吃不掉,所以你先做。等模型吃掉了,你再做新的部分。

我们想得比较长远,所以最近看很多科幻作品,把想象打开。今天把你能想到的最狂野的东西多想一点,AI 现在基本都能做到,或者一两年后能做到。

余一:你现在想的最狂野的东西是什么?

橘子:分阶段看。2030 年 AGI 后,AI 会自我迭代,人类会越来越跟不上。到那时,人也许反而会回到喝茶、手磨咖啡、看书、和朋友聊天。世界加速不再需要你,传统工作也不一定存在。

品味守不住护城河,愿望和信仰更可能留下

https://docimg10.docs.qq.com/image/rHZovl-vTu2xydq4PDmrcg.webp?w=6400&h=3600
https://docimg10.docs.qq.com/image/rHZovl-vTu2xydq4PDmrcg.webp?w=6400&h=3600

品味不是护城河

余一:大家都说 AI 时代人的品味、决策质量会更重要。你怎么定义品味?怎么确保自己不成为公司和人机协作中的短板?

橘子:品味只是当下 AI 还没完全学到的东西,迟早会学到。如果美是客观的,AI 一定可以学到。

最后真正属于人的,也许会从品味和判断,转向信仰一件事的能力。飞机还没出现时,有人相信一定能造出飞机,然后不断尝试。人类进步来自先有狂野猜想,再去验证。

不要扼杀想象,不要扼杀猜想。AI 在原动力和创作心力上永远差一点,它需要人给它一个愿望。

余一:我也有类似冲击。之前看到 AI 把我很细微的想法、美感和叙事,用比我更擅长的方式做出来,我开始怀疑品味是不是人类最后的堡垒。

橘子:品味不是护城河。未来生产能力不稀缺后,每个人可以做很多自己想做的事情,不一定都有金钱价值。开心本身可能变得重要。

Token 效能和组织管理

余一:你们现在遇到新的挑战是 AI 用量过多过猛。团队怎么评估大家的 token 使用?

橘子:团队用 AI 也会两极化。最开始担心大家不用,就 push 大家用。后来发现用太猛。

做 Cola 时,有个需求是生成界面要等 10 分钟,能不能给用户玩点小游戏作为过度。一个同学手搓了 30 个小游戏,花了好几千美元。我说这太多了,这些游戏够玩 10 年。

所以虽然给大家 token 自由,但还是要看 ROI。最后还是要提升每个人的判断力。

上个月账单有点触目惊心,好几万美元。这个月开始让大家多用 Codex,因为更省钱,也好用。运营同学说 Cola 像两个实习生帮他干活,但她那几天每天 token 消耗 200 美元,相当于七个实习生,也不能这样花。

超级个体和超级组织

收尾两问

余一:如果给那些想要跃迁但还没有动的人,尤其是创业者,一句话建议是什么?

橘子:做一个全新的事情,围绕 Agent 做一个全新的组织。一定要在一起做。

余一:如果让你问其他创始人一个问题,你最想问什么?

橘子:你现在现实中最大、压在你心里的、最有分量的东西是什么?你是怎么应对它的?

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档