首页
学习
活动
专区
圈层
工具
发布

MoonBit Pilot:全球首个自底向上的代码智能体,比Cursor更快更稳定

前言

软件工程领域因为大模型的赋能正在发生一场革命性的变化。代码智能体(Coding Agent)不再是人类开发者的助手,而是全新的软件合成引擎。这意味着代码智能体不再止于生产力工具,而是具有端到端的软件交付能力,孕育着万亿美元的商业价值。

但反观市场上的代码智能体,都是基于已有的开发者工具和大模型结合来调教生成代码;这是因为已有的开发者工具,都是在大模型时代之前为人机(Human Computer Interface)交互设计的,对于这样一场革命性的变化:【只有从底层设计一整套原生的 AI 开发者工具(Agent Devtools Interface),并与大模型垂直整合,才能更好的发挥大模型的潜能,生成更高效,更可靠的代码。】

MoonBit Pilot 正是在这一愿景下诞生的——从底层设计一整套 AI 原生的开发者工具,包括编程语言的设计、编译器、调试器、包管理等,并在各个环节给予大模型最有效的反馈。

这类颠覆式创新,往往意味着在早期阶段需要付出巨大的研发投入,而要在此基础上构建生态体系,更是一场长期的耐力赛。然而,MoonBit Pilot 已经在现有大模型能力之上展现出强大潜力:不仅能自动高效地生成完整软件库,并附带结构化文档与高质量测试用例,还在软件工程中最关键的环节之一「大规模代码重构」中展现出领先优势。在这一点上,它的表现甚至超过了“主流编程语言 + 最强大模型”的组合。

团队预计接下来半年时间,将通过 MoonBit Pilot 来完成 MoonBit 语言生态的自举,这样一个闭环的应用场景,也将为 MoonBit Pilot 提供海量的训练语料合成积累大量的经验,最终实现软件合成的“圣杯” -- L4 级别的软件自动交付。

零干预合成高质量软件库

下面我们用 MoonBit Pilot一键生成 TOML 语法解析器作为示例来展示其软件合成能力:

TOML 是一种配置文件格式,设计初衷是简单易读、易写,并且能清晰表达嵌套的数据结构。它常用于项目配置文件,特别是在 Rust 生态中被广泛使用。

让我们打开 VSCode 运行下测试:

我们注意到,大模型最初生成代码时,因缺乏 MoonBit 语料,未能直接输出正确结果。但在自动调用 MoonBit 自研工具链并获取精确反馈的过程中,模型无需人工干预便完成了修复与优化,最终成功输出了正确代码,并自动添加了有效测试,整个过程耗时仅约 6 分钟。

不只是 TOML,MoonBit Pilot 在很短时间零人工干预合成了 ini-parser(https://github.com/bobzhang/ini-parser),lisp 解释器(https://github.com/bobzhang/lisp-machine-MoonPilot)等更多示例,而这些合成的软件库也将用于下一代基模的训练,更好的提升 MoonBit Pilot 的软件合成能力。

支持超大规模代码重构,提升代码质量

AI 生成的代码一个普遍的痛点就是缺乏可维护性,而提升代码可维护性的一个最重要的方法就是安全重构。这里以一个简单的函数重命名作为示例。

假设我们需要将标准库 Core 中的 Array::length() 改名为 Array::len(),我们先发出 prompt 指令:

can you add 'Array: :len' which is the duplicate of 'Array:: length' and deprecate the latter

Prompt: can you add 'Array: :len' which is the duplicate of 'Array:: length' and deprecate the latter

可以看到,MoonBit Pilot 短时间内即可正确的完成任务:

MoonBit Pilot 正确的完成任务

不同于传统智能体依赖 grep 等基于正则的代码查找方式,MoonBit Pilot 提供了原生的语义查找工具,能够一键精确定位代码定义。这不仅提升了交互体验,更重要的是显著减少了 token 浪费,从本质上降低了推理成本,是 Coding Agent 系统中少有的“具备实际节省支出能力的模块”。在完成了代码变化以后,因为 length 这个函数被海量的使用,触发了大量的警告,我们看下 MoonBit Pilot 如何修复这些问题。

分段编码,快速的高并发重构

传统 Agent 在执行此类修复任务时效率极低,往往需要反复调用构建系统获取警告信息,并以串行方式逐一调用大模型修复,每次调用可能耗时十几到几十秒,完整修复过程可能持续数十分钟。同时,这类 Agent 缺乏对警告的结构化处理,导致上下文信息冗杂、重复,进一步干扰大模型的判断与执行效率。

MoonBit Pilot 充分利用底层的 Subagent 机制以及 MoonBit 语言自身提供的分段机制,避免并发提交和验证中的竞争和隔离问题,确保并发后的结果能有效合并。

在 MoonBit Pilot 中,只需要简单一句提示就可以触发为 MoonBit 高度优化的工具,尝试进行并发的警告修复工作,并且最终实现从代码到文档的全面修改替换:

Prompt: fix all deprecation warnings

该工具以单一源代码文件的某一分段为基本单位,在启动 Subagent 修复子任务的同时,将任务范围限定在该基本单位内,并实现了独立于其他子任务的验证功能:从而实现了真正意义上的多 Agent 并行修复能力,相比传统 Agent 工作流可以实现 5 至 10 倍的效率提升。

速度远远快于Open AI (Codex)、Cursor,且更可靠

在实际修复一个包含 126 条警告的 MoonBit 大型项目时,MoonBit Pilot 仅用市面主流代码助手 Cursor 和 Codex 所需时间的 1/5,显著领先于当前行业标准。

Codex CLI :35 分钟后仍然没有完成所有警告的修复工作,并且需要中途加入额外的对话内容才能继续任务。

Cursor :16 分钟后会因为触发最大工具调用次数而中止,此时剩余警告数并不为 0,在相同提示词的情况下同样会触发串行的警告修复任务。

相比之下,MoonBit Pilot 仅用约 7 分钟即完成了上述 126 条警告的全部修复任务。

值得注意的是,大部分 Agent 和语言工具链的组合往往只能完成代码的修正工作,但得益于 MoonBit 语言对 Markdown 格式的特殊支持,MoonBit Pilot 也能确保 .mbt.md 文档中代码的正确性。

另一种范式:云端异步编程, 零人工干预

上述两个 Demo 均需在用户本地环境运行,需要用户的频繁交互,很难做到一个高并发的运行(同时启动十几个任务),如果能够脱离用户的电脑在云端运行,只需要关注效果和代码审查,生产力会得到极大的提升。

也正是 MoonBit Pilot 这样一套完全 AI 原生的工具链设计,使得 MoonBit Pilot 不同于以往基于 VSCode 的 AI 智能体,其反馈机制不再依赖传统的 LSP(Language Server Protocol),而是一套内部高度定制的(Agent Server Protocol),这样 MoonBit Pilot 可以脱离 VSCode 等 GUI,高效的部署在云端,并取得完全一样的效果。

以下是使用 Web 端版本的 MoonBit Pilot  在一个真实 MoonBit 项目 (https://github.com/moonbit-community/cmark.mbt)中进行自动警告修复的例子。在进入任务总览视图后,可以点击“新建按钮”创建一个新任务。在新建任务页面,我们可以指定目标仓库,并在提示词中说明我们的意图,即修复项目中的所有警告:

稍等一段时间之后,我们便可以看到任务已经变为完成状态。

点击任务卡片可以查看本次任务的用时、对话历史、控制台输出等详情:

在对话历史的末尾,可以看到 MoonBit Pilot 已经成功创建了与修复内容相对应的 GitHub Pull Request:

此 Pull Request 描述和内容完整,CI 检查顺利通过,可以直接合并。

CI 检查顺利通过,可以直接合并

未来展望: 基于 MoonBit Pilot 的软件合成工厂

MoonBit Pilot 不仅仅是一个编程助手,更是未来实现“软件合成工厂”愿景的重要基石。

传统软件开发模式依赖大量人力投入,效率低下且开发周期漫长。在 AI 迅速崛起的时代,虽然大模型和 AI 辅助编程工具都在快速发展,但由于缺乏与语言层面的深度协同,彼此孤立发展,难以发挥整体优势。

MoonBit 社区则基于 MoonBit 的语义基础和 Agent 的智能协作机制,正致力于从单纯的‘写代码’迈向高效的‘构建软件’新范式:

1. 从代码生成到软件级合成

Agent 的目标不仅局限于辅助补全若干行代码,而是通过 prompt 驱动、大模型推理与 MoonBit 语言工具链的高效联动,真正实现工业级软件的自动化构建。

2. 从交互式 Agent 到流水线式合成引擎

借助 MoonBit 工具链对及先进的 Segment 并发机制,MoonBit Pilot 已经进化成一个支持多任务并行、具备状态感知的流水线式 Agent 系统。每个子 Agent 如同生产线上的一台精密机器,围绕用户需求并行协作,快速完成复杂的任务。

3. 构建自动化工具链合成接口

MoonBit Pilot 进一步提供开放 API 接口,轻松连接第三方系统(如 CI/CD、IDE 插件、AutoCoder、代码审查系统等),极大降低系统接入门槛,使开发者和企业能以极低的成本快速享受类 Devin 式的自动化开发体验。

总结

我们相信,软件开发正迎来一次范式的转变:

从“写代码”到“构建软件”,从以人驱动的开发工具,到以智能体主导的系统合成流程。

而随着 MoonBit 语言生态的不断成熟,我们有信心推动这套架构成为一种全新的工业标准,真正迈入软件自动生成、自动验证、自动部署的流水线时代。

体验方式:doc.mbt

目前,MoonBit Pilot 面向所有用户支持桌面端一键安装体验:重新执行官网安装命令(https://www.moonbitlang.com/download#moonbit-cli-tools),即可通过 moon pilot 启动 MoonBit Pilot 的命令行版本。

云端 Web 版本目前是定向邀请制开放,完成任务立即体验 。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OO4ggI3OcH2IwNt94ZLFYTew0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券