我感觉自己的电脑使用水平在过去的 1 个月已臻至化境。确切地说,是我使用电脑处理常见问题的能力上了一个新台阶。
这当然是 AI 的功劳,我只是从三轮车夫忽然换了座驾,变成保时捷轿跑司机,感觉天下我有,何处行不得。
第一次有这种感觉是我试图搭建一个小项目,充分利用 macOS 的识图功能,随时把需要提取文字的图片素材丢进去,再整理成文字。
我对 OCR 代码的各种库一无所知,对 macOS 的内置代码更是一窍不通,全凭想象和无知进行探索。代码反正不是我写,选什么无所谓。AI 最熟悉 python,那就 python。
几番折腾之后,我发现不行。苹果内置功能很难通过 python 调用来实现。Gemini 两手一摊,建议我用其他的 python ocr 代码库。我想,那怎么行,要的就是矫情。既然 python 不行,直接换Swift,苹果原生的开源编程语言。
毫不夸张,生成这段 Swift 代码,再加上编译成 macOS 下可以运行的命令,只花了 5 分钟。1 分钟生成代码,半分钟拷贝粘贴到 xcode,瞬间编译完成。剩下 3 分钟我用来找编译好的可执行文件在哪儿。
生成的程序相当规整。带参数,带提示,带例子,专业到家了。我立刻打开思路,以后 Mac 上缺什么工具,我直接跟 AI 说就完了,立刻马上自己写一个贴心的小棉袄。再也不用为“这些狗屁工具为什么这么难用”而发愁。
比生成编译好的命令行工具更方便的还是 python 代码。ChatGPT 在更新到 o3 之后,对话态度略显谄媚。每次我问它技术问题,它就会在对话的最后殷勤地问:要不要我现在帮你写一个脚本,你马上就能用上!Gemini 上礼拜学习到了这种态度,也会在对话结尾处建议,让它来搞定这一切。
我逐渐习惯它俩的陪伴。简单的问题一个 shell 脚本搞定,复杂的问题 python 上。我的云服务器磁盘空间被日志占满,手工清除之后,我让 Gemini 写了一个 shell 脚本:定期清空日志,检查剩余磁盘空间,当空间低于某个值时,通过 bark 给我的 iPhone 发消息。
这件事放在以前,我得弄好几天。别的不说,光是测试 bark 消息的正确格式,就得看一会儿文档。
现在全不用。任何我想要在手机上收到提醒的事项,都可以通过 bark 来完成。我只要提要求,AI 自然会按照我想要的格式发信息。从此,天下屁事尽在掌握。
我推荐每一个会用 AI 的人,都看一下 bark。这个超级简单的消息推送工具,可以让你从容在手机上收到各种定制化的提醒。不用自己搭服务器,不用自己编程,只要你想,没有 Gemini 做不到的。连在电脑上设置自动化定时任务,Gemini 都能手把手带你完成,而且极富耐心。
记不住命令,忘记编程语法,想不明白函数怎么写,都不重要。只要把话说清楚,不管是 Gemini 还是 ChatGPT,都能顺利完成任务。
前天,收到一份合同模版,让我发表意见。我本想找律师朋友看看,后来发现里面没有敏感内容,干脆上传到 Cherry Studio,让内置的法务助手调用 Gemini 帮我审查。
结果相当好,不比公司里的普通法务差。Gemini 给我提了一大堆改进意见,从违约条款到责任认定以及合同概念明确,方方面面都照顾到了,尽职尽责。比起两年前的大模型,现在的 AI 水平有了质的飞跃。完全可以帮助一个对目标领域一无所知的人,迅速输出高于平均水平的内容。
做到这一切,只需要一个前提。尽可能和 AI 多在一起,多用,习惯和它们对话,掌握表达技巧。只有将AI 融入到日常生活中,才能建立起流畅的 AI 思维,让它听得懂你想要干什么。
在我的使用中,Gemini 的幻觉随着迭代,越来越小。ChatGPT 也不错。o4-mini 思考模型,无需手动点击网络搜索,就会根据问题自己主动上网搜索信息源,然后归纳总结。
我下午让它比较阿卡西斯雷电 5 硬盘盒与竞品绿联之间的异同,ChatGPT 做得相当不错。
周六,老妈想要换强排式燃气热水器。我让 Gemini 做了一份深度研究报告。
有了深度研究,各类导购文章和产品对比分析几乎不用再看。没有真人体验,明确观点的水文在这些报告面前毫无价值。
Gemini 甚至可以为这份报告再生成一份音频概览。
在信息收集和整理方面,AI 的优势极为明显。它们能够迅速汇总网络信息,形成可阅读的报告,甚至结论。以后,一些简单的参数对比,产品分析,完全可以交给 AI,让用户省去大量时间。
我问 ChatGPT,为什么我的 defi 项目投了快一个月,还没产生收益。它给出了想当详细的说明,并让我再耐心等待一段时间。
顺便说一句,我的美股分析报告迭代了好几版,美观程度渐次上升,有成就感,也乐在其中。享受全面定制的乐趣。
目前在做的另一个自动化任务,是将下载后的美剧剧集自动按照 NAS 上已经存在的文件夹分别存好。
没有大模型,这件事靠代码几乎不可行。文件名和文件夹之间必须用正则表达式严格计算。现在,大模型可以根据语义的理解,自己找到最恰当的文件夹,甚至区别 Season1,Season2,把文件放到正确的目录中。
以后我想看剧,iPhone 上会有新剧提醒,打开电视刷新即可观看。下载,上传,做字幕,全部自动化。享乐的成本越低,快感越高。
这一切是多么美妙。
领取专属 10元无门槛券
私享最新 技术干货