你有没有过这样一种感觉——每天坐在电脑前,打开邮箱、登录后台、复制粘贴、截图保存,手指机械地重复着同样的动作,脑子却早已飘到了窗外,心里不停地在想:这些事情如果能有个人替我干了该多好?
今年年初,老板说了一句话,让我整个人都兴奋起来:“未来每个人手下都会有很多个AI员工,你只需要发指令,它们就能帮你把活干完。”而就在今年三月份,一个叫做“小龙虾”(OpenClaw)的开源AI智能体框架突然爆火,它让AI真正长出了手脚,能够像真人一样操作你的电脑、点开网页、下载文件、发送邮件——那个藏在脑海里的“虚拟员工”,突然就有了落地的可能。
于是我真的动手了,用腾讯出品的WorkBuddy(也叫腾讯龙虾),亲手把两个最折磨人的工作环节丢给了AI。今天这篇推送,就想跟你聊聊这两个真实的故事、两个让我豁然开朗的技巧,以及两个差点让我崩溃的坑。
案例一:邮件管理,让AI替我处理重复工作

每个月最让我头疼的事情,就是和供应商对账:他们会把账单和发票通过邮件发过来,我得一封一封地搜索供应商名称、下载附件、打开表格核对数字,核对完再回复一句“确认”,等对方发来发票后再次下载……光是上周,核对账单花了7个小时,发起付款流程又花了9个小时,整个人被邮件淹没了。
我决定先把邮件这块交给小龙虾。首先在腾讯企业邮箱里做了一点准备工作:凡是带附件的邮件,自动归档到“星标邮件”文件夹里,这样AI只处理真正需要关注的内容。
然后我打开WorkBuddy,直接跟它对话:“帮我登录企业邮箱。”它一步一步引导我输入相关资料,居然真的成功了。接着我让它“下载所有供应商发来的对账单附件”,它照做了。那一刻我心里有点激动,但又隐隐不安——万一它把我的邮件删了怎么办?万一它自动回复了一些不该回复的内容怎么办?所以我给它立了一条铁律:不能自动删除任何邮件,也不能自动发送邮件,凡是涉及到这两类操作,必须先经过我授权。
接下来的调试过程其实挺磨人的。比如小龙虾一开始会把邮件正文里的图片也当作附件下载下来,我得告诉它“只认.xlsx或.pdf格式的文件”;再比如我希望它遇到一封邮件有多个附件时,自动新建一个文件夹来存放,否则所有附件都堆在一起会乱掉。就这样一点一点地微调,等所有细节都跑通之后,我让它把整套操作封装成一个Skill(技能)。然后我直接把所有供应商名称列给它,说“批量执行”,它就真的开始一封一封地检索、下载、归类——当看到任务列表里一条条绿色的“完成”状态跳出来的时候,那种“积木终于拼上了”的爽感,真的很难用语言形容。
当然我也交了一点学费。今天前前后后调试下来,消耗了200积分(WorkBuddy送了6000积分,暂时够用),而且第一次批量执行的时候,我发现它并没有下载完全部邮件——幸亏我提前让它输出了每一步的执行状态表,人工快速扫了一眼就发现了问题。这让我深刻意识到:数据源一定要干净。有的供应商邮件标题写的是简称,有的干脆不写公司名,AI当然搜不到。后来我一方面要求供应商统一邮件主题格式,另一方面在指令里加入了所有可能的别名和简称,容错率一下子就上去了。
案例二:键鼠操作,模拟真人的批量操作

如果说邮件管理还只是“读取和整理”这类轻量级操作,那么第二个案例就真的涉及到复杂的键鼠操作了。每个月发起付款OA的时候,我需要从公司业务后台一个一个搜索供应商名称,找到对应的分钟数,然后截图保存下来。几十个供应商,挨个搜索、截图、重命名、存到指定文件夹,每次都要花上大半天。
这次我要让小龙虾模拟真人操作:先登录后台,然后在搜索框里输入名称,点击搜索,等页面加载出数据后,截取指定区域,最后把图片存到我的文件夹里。我告诉它每一步“点什么、输入什么”,让它先小范围试一下——只循环执行5个供应商。
结果第一轮跑下来,5张截图里有3张都是不完整的,有的只截到了页面头部,有的把登录页也给截进去了。我没有急着骂它,而是开始不断地提问:“你为什么截到了登录页?”它自己分析了一通,最后说可以通过图片的尺寸大小来判断到底是登录页还是数据页,并且通过识别页面上的文本内容来确认当前是不是“搜索完成”的状态。就这样,我问一个问题,它给出一个解决方案,我再试,再问,再改——差不多来回折腾了十几轮,5个供应商终于全部合格了。
但真正的考验在后面。当我开始批量跑50个供应商的时候,问题又出现了:AI明明要执行“搜索→等待结果→截图→保存”这四个步骤,可它经常在第一步搜索之后就卡住了,直接跳到截图,结果截的图当然什么都没有。我死活找不到原因,后来灵机一动,让它每执行一步就给我截一张图——通过对比每一步的截图,我才发现原来是页面加载有延迟,而AI的键鼠操作太快了,系统还没来得及弹出搜索结果,它就已经按下了截图键。这就像你让一个小孩跑得太快,鞋带散了都不知道。于是我在每一步后面都加了一条“停顿2秒”的指令,再跑一次,一切正常了。
还有一个让我特别有成就感的小发现:截图总是显示不全,页面内容被裁掉了一部分。我反复检查指令,AI自己也查不出原因。后来我突然想到自己平时打开浏览器窗口的习惯——我从来不会把窗口最大化,而是保留一个窗口化的大小,但这个大小每次可能都不一样,导致截图区域忽大忽小。这就是所谓的“业务体感”:你天天在做的事情,你自己都意识不到那些默认的肌肉记忆。于是我加了一行“窗口最大化”,问题瞬间解决。那一刻我真的觉得,当你和AI一起调试了几个小时,最后因为一个你亲身经历的细节而搞定所有bug时,那种快乐比打游戏通关还要强烈。
两个让我事半功倍的技巧
第一个技巧:及时总结skill文档+文字描述备份。
一只虾辛辛苦苦调试好的Skill,要马上封装成一个可读的.md文件存下来——因为小龙虾的上下文是会被吃掉的,有时候WorkBuddy更新后,以前聊的部分内容可能就看不到了,以及还会出现因为在线人数过多,龙虾直接停摆好几个小时的极端情况。但只要你有存档,另一只虾装上同样的Skill就能立刻顶上,不会因为一只虾崩溃而让整个工作断片。

第二个技巧:让AI输出执行状态表。
永远不要相信AI会一次性完美地完成所有任务。每次让它批量执行的时候,都要要求它输出一个表格,列出每一步的完成进度、成功或失败的状态、以及失败的原因。这样你一眼就能看出哪里出了问题,而不是等到最后才发现90%的结果都是废的。这个习惯帮我节约了大量的试错成本。

写在最后
说实话,现在的小龙虾还远不够完美。4月2号那天,WorkBuddy全服崩溃了一整个下午,恢复之后还时不时报错;复杂的键鼠操作偶尔还是会因为页面元素识别失败而卡住;目前市面上大多数人用小龙虾做的事情,其实还停留在“信息抓取和整理”这个层面——说白了就是让对话式大模型多走了一步,能够每天播报和存档而已。
但对我来说,它已经实实在在地帮我砍掉了对账和付款流程里一半以上的耗时。那些重复的、规则明确的、不需要人类创造力的工作,我终于可以放心地交出去了。剩下的时间,我可以安安静静地去做业务洞察、去想产品方案——那些只有人才能做的事情。
我有时候会想,也许未来的某一天,我手下会同时跑着十几只小龙虾,有的帮我回邮件,有的帮我做报表,有的帮我对接供应商,而我只需要在每个早晨跟它们开个短短的“晨会”,然后就去喝一杯咖啡。这个场景听起来还有点遥远,但当我看着屏幕上那个刚刚批量下载完50份附件的绿色状态条时,我知道——它已经开始了。
#公众号:科科课代表
#腾讯云OpenClaw玩虾大赛
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。