
最近做 AI 内容工具的人,绕不开一个问题:
Agent 到底应该交付什么?
以前大家让它写 Markdown、写大纲、写一份能复制进 PowerPoint 的文案。结果到了最后一步,还是要人自己调字号、挪图片、改封面。
这件事很烦。
所以我最近看到 guizang-ppt-skill 时,第一反应是:这次交付物直接放进浏览器了。
项目来自最近国内很火的前大厂 UI/UX 设计师 「歸藏」大佬。

截至我查看仓库时,它已经有 10.5k Star。
开源地址在这里:
https://github.com/op7418/guizang-ppt-skill
怎么说呢,光说“AI 会帮你做 PPT”已经没什么新鲜感。
这个项目真正可用的地方,是它把 PPT、配图、封面、浏览器演示,放进了同一套 HTML 工作流。
guizang-ppt-skill 是一个给 AI Agent 用的 PPT 生成 Skill。
你把文章、Markdown、产品分析、演讲素材交给 Claude Code、Codex 或其他能读写文件的本地 Agent,它会按一套固定流程生成单文件 HTML 横向翻页 PPT。
这里要先说清楚:它最终产物是 HTML 演示,不是 .pptx 演示文稿。
这会影响使用范围:
也就是说,它不是 PowerPoint 的平替。
它更像一个“文章到演示网页”的 Agent 工作流。
仓库里内置了两套视觉系统。
一套是 Style A,电子杂志 × 电子墨水。它更适合观点表达、个人分享、线下演讲这类内容。

另一套是 Style B,瑞士国际主义。它强调网格、直角、发丝线、单一高饱和锚点色,更适合产品分析、方法论、事实表达。

README 里明确写了,Style A 有 10 种布局,Style B 有 22 种锁定版式。Agent 不是临时写 CSS,而是在模板范围里选版式、填内容、做自检。
它支持横向翻页、键盘 ← / →、滚轮切页、触屏滑动、底部圆点导航。ESC 能打开索引,B 可以切到低性能静态模式。
实际上单文件 HTML 对演示很友好。浏览器能打开,就能讲。
很多 AI PPT 工具看起来每页都在自动排版,细看却没有稳定规则。
guizang-ppt-skill 好一点的地方,是它把 Agent 的发挥框在模板里。
两套风格不用在文字里讲太满,看图更快。


我更在意的是它背后的思路:少让 Agent 自己发明页面,多让它在已有版式里做选择。
这对内容型 PPT 很重要。
因为多数人不是卡在“能不能生成一页”,而是卡在“生成到第 5 页还能不能像同一份东西”。
它还给 Style B 配了一个校验脚本:
node scripts/validate-swiss-deck.mjs path/to/index.html
脚本会拦住一些明显跑偏的页面,比如标题位置不对、图片脱离槽位、SVG 里塞文字。
这些不是什么炫技功能,但很有用。
AI 做视觉内容,最怕的就是第一眼像样,细看全是小问题。
另外,它没有只停在 PPT 页面。
配图、公众号头图、小红书封面、视频号封面,也可以沿着同一套视觉方向继续做。

这才是我觉得它值得写的地方。
它不是把一个按钮包装成“AI PPT”,而是把文章、演示、配图、封面这些内容生产里的碎活,尽量放进同一条线。
当然,别把它想得太万能。
如果你要做一份能在公司内部反复改、多人协作、老板逐字批注的 PPTX,它不是最合适的工具。
如果你的目标是快速把一篇文章变成一次分享,一份 HTML 演示稿已经够用了。
如果你已经在用支持 Skill 的环境,直接跑:
npx skills add https://github.com/op7418/guizang-ppt-skill --skill guizang-ppt-skill
也可以手动克隆到 Agent 的 skills 目录:
git clone https://github.com/op7418/guizang-ppt-skill.git ~/.claude/skills/guizang-ppt-skill
或直接丢给 Agent 项目地址,让它帮你安装。
装好之后,确认目录里有这几项:
SKILL.md
assets/
references/
然后直接把需求发给 Agent。
比如:
用 guizang-ppt-skill 生成一个介绍 xxx 的 PPT。
实际流程不复杂:先选 Style A 或 Style B,用 7 问清单确认风格、受众、时长、素材、图片需求、主题色和硬约束,再从模板拷贝 HTML,做主题节奏表,挑 layout 骨架填内容。
下面以大家都能使用的WorkBuddy示例:

如果使用的是 Codex,还支持生成配图并按比例插入。最后对照 checklist 自检,用浏览器预览,对字号、间距、高度做小修。
它不太适合大段表格数据,也不适合多人协作编辑。
它更适合线下分享、私享会、Demo Day、AI 产品发布、行业内部讲话。尤其是“我有一篇文章,现在要快速变成一场 8 页左右演讲”的任务。
我对这个项目的判断很简单:
Agent 与人类的交互,正在越来越多地通过 HTML 这种可视化中间层完成。
它没有 .pptx 那么适合传统办公协作,但它更适合被 Agent 读、改、检查、预览。
对创作者来说,它没帮你省想观点的时间。它省的是搬文件、裁图片、改排版这些碎到不想说的事。
觉得有用?欢迎转发分享给需要的朋友!