VTJ.PRO的AI和Skills系统之所以强大,核心在于其采用了 “Agent + Skills”的智能体架构。这个设计背后,其实是为了解决一个核心矛盾:让AI不仅能“理解”你的需求,更能“动手”在复杂的开发环境里把它实现出来。
简单来说,AI不再只是一个聊天机器人,而是成为一个能主动思考、并熟练使用各种工具(Skills)来完成开发任务的智能体(Agent)。下面我们从三个层面来拆解它为什么要这样设计,以及具体是如何实现的。
0e74c64edf1d0e4c7ec2d6765a5bf5f6.png
🧠 核心驱动力:Agent + Skills 架构
这个架构将AI从一个被动的命令执行者,升级为一个主动的“开发搭档”。
- AI智能体(Agent):扮演“大脑”的角色。当你提出一个复杂需求(例如“创建一个带搜索功能的用户管理表格”),Agent会负责将这个任务拆解为多个可执行的步骤,比如“先创建表格组件”、“再添加搜索输入框”、“最后配置数据绑定”等。
- 技能系统(Skills):扮演“双手”的角色。它是一系列AI可以直接调用的设计器功能,比如“添加一个Button组件”、“修改Table组件的columns属性”、“绑定API数据源”等。目前,这个工具箱里已经内置了40多种专业的开发工具。
这种架构的精妙之处在于,当AI决定调用某个Skill(比如添加组件)后,系统会自动根据执行结果,决定是否需要继续下一步,从而实现流畅的多步操作,而无需你为每一步下达指令。
🛠️ 具体实现:AI如何一步步工作?
这套架构通过一个清晰的分层管道落地,确保了从你的想法到最终代码的每一步都精准、可控。
deepseek_mermaid_20260304_5e5d38.png
- 接口层:接收你的多模态输入——无论是自然语言(如“创建一个登录表单”)、设计图像(如Figma截图,上传的图片文件需≤10MB),还是结构化JSON数据(如设计稿导出文件,需≤5MB)。
- 逻辑控制层:这是系统的“调度室”。它负责管理整个对话的状态(如等待、流式生成、完成或出错),并通过一个统一的API网关与后端的AI模型通信。
- AI处理层(智能体核心):这里是“大脑”所在。AI会结合当前项目的上下文(如已有组件、DSL定义、项目依赖等),理解你的意图,并决定下一步是生成代码,还是需要调用特定的Skills。
- 引擎集成层(技能执行):这是“双手”工作的地方。
- 如果AI决定调用Skill,系统会通过一个“工具注册表”来验证并执行这个调用,直接操作设计器里的页面元素。
- 如果AI生成了代码,系统会通过一个双向代码转换管道,将AI生成的Vue代码与平台底层的DSL(领域特定语言)进行互转,最终把变更应用到你的项目中。
✨ 这种设计带来的独特价值
这套机制不仅仅是一个技术概念,它给实际开发带来了几个非常实用的好处:
- 告别“一次性”生成,实现“增量更新”:以前AI修改代码,往往是整个文件重写。而现在,AI可以通过增量更新模式生成代码“补丁”(diff格式),像外科手术一样精确地修改现有代码。这能将生成效率提升200%,Token消耗锐减70%。
- 让AI的思考过程“透明化”:系统支持流式响应,你可以在界面上实时看到AI的推理过程和思考链条,而不是面对一个黑盒突然吐出一大段代码,这让协作和调试变得更容易。
- 结果稳定可靠,不“抽风”:AI生成的代码在被应用前,会经过一系列严格的验证,包括语法检查、组件命名规范、依赖完整性校验等。不通过的代码会被拦截,并给AI反馈,让它尝试修复。此外,在生成复杂逻辑时,系统甚至可以通过多模型协同决策(例如,让Gemini和Claude分别生成方案,再自动择优),将业务逻辑准确率提升至98.7%。
你是打算在自己的项目中深度定制VTJ的AI能力,还是想在自己的应用中集成类似的Agent架构?告诉我你的具体目标,我可以帮你分析更适合的实现路径。
参考资料:
开源仓库:https://gitee.com/newgateway/vtj