需求文档写完了,但测试工程师读到的和产品经理写的并不是同一个意思。开发实现了功能,但测试用例是在实现之后才开始设计的。发布前密集地补测试,上线后依然有缺陷逃逸。...
有一个判断,技术圈里几乎没有人会反对:AI 在过去三年里的进步速度,超出了绝大多数人的预期。从 GPT-3 到 GPT-4,从文本生成到多模态理解,每一步看起来...
产品经理洋洋洒洒讲了两个小时,PPT 翻了四十页,会议室里的人状态各异——有人在认真听,有人在处理邮件,有人在等轮到自己说话,有人在心里默默计算这个需求到底做不...
功能验证跑完了,缺陷已经关闭,上线倒计时却逼着你在一小时内交出一份“专业的测试总结报告”。你打开模板,复制粘贴数据,拼凑几段定性评价,最后在“测试结论”那一栏写...
AI 工具正在快速进入测试团队的日常工作,但大多数团队的使用方式,停留在同一个层次:打开对话框,输入问题,获得回答,然后把这个过程重复一百遍。
一个 AI 应用上线之前,几乎所有团队都会做功能测试:输入正常问题,验证回答是否准确;测试边界条件,确认系统不会崩溃。这套测试流程在逻辑上无懈可击,在实践中却留...
与那些“只生成代码”的 AI 助手不同,testers.ai 的核心是 “AI Skills” —— 一种可跨平台复用的专业测试能力单元。正如其官网标语所说:
用 Martin Fowler 的话说:"这是在 AI 时代保持代码质量的新型工程实践。"
近年来,‘AI赋能软件测试’已成为行业高频热词。然而,据2023年《中国DevOps与AI测试实践白皮书》统计,超68%的企业仍停留在POC(概念验证)阶段,仅...
2024年,大模型驱动的AI智能体(Agent)已不再是实验室概念——AutoGen构建的金融风控分析助手、LangChain调度的电商售后决策流、字节跳动内部...
在AI工程化落地加速的今天,一个高准确率的模型≠一个可交付的模型。真正决定AI系统成败的,往往不是训练时的炫酷指标,而是上线前那场严谨、多维、贴近业务的模型评估...
在传统软件测试时代,测试工程师的核心价值常被简化为‘用例执行者’或‘缺陷捕手’。而随着大语言模型(LLM)深度融入产品架构——从智能客服、代码补全到AI原生应用...
* **Harness Engineering 本质上是把 DevOps 的思想引入到了 AI 领域**。它承认 LLM 是非确定性的,因此用确定性的传统软...
本文聚焦工程落地:从最简单的 Buffer Memory 到生产级的向量记忆、图记忆,一步步带你把 AI 记忆真正跑起来。所有代码均可直接运行。
很多人看完都在讨论,印度有钱、有工程师,还有苹果组装的成功经验,造芯应该不难?但是事情并非想的这么简单,我得理性泼盆冷水:芯片不是“有钱就能砸出来”的,莫迪的造...
腾讯 | 前端开发工程师 (已认证)
这几天,朋友圈被“裁员”刷屏了。阿里、字节、网易,连一向岁月静好的 B 站也没能幸免。更夸张的是,有的城市、有的业务线是整锅端,直接清零。
关心我的读者朋友肯定发现,我已经断更一个多月了。这期间忙活了很多家务事,因为琐事太多了,所以我就趁碎片时间刷网络小说奖励自己。这几天想着,公众号文章还得继续坚持...
因为整个仓库都是由智能体生成的,所以我们首先优化的是 Codex 的可读性。就像团队会努力提高代码对新入职工程师的可导航性一样,我们的人类工程师也把目标设定为:...
同样是问 AI,你问"帮我写个总结"和"你是一位专业的技术文档工程师,请用 200 字以内,以要点形式总结以下内容,突出技术亮点",得到的结果天差地别。
腾讯 | 高级前端工程师 (已认证)
他说:高薪软件工程师如果还没有把大量的 AI token 用起来,反而应该感到紧张。