🍹 Insight Daily 🪺
Hi,这里是Aitrainee,欢迎阅读本期新文章。
我们来测试一下Claude code里使用GLM4.5的效果,并对比Deepseek 3.1。
此外,我会在文末介绍本次测试涉及的一些Claude code使用经验,特别是Claude code Windows条件下配置mcp的一些经验。
还会介绍如何使用 Claude-code-router 给Claude Code接入 GLM、Deepseek、K2、Gemini 等模型,以及哪些平台提供免费模型。帮不熟悉 Claude Code 的朋友 祛魅—— 无顾虑地把 Claude Code 用起来。
此外,智谱模型API优惠活动倒是挺多,这次有一个20元包月活动,GLM + Claude Code可以爽玩,比直接调用API划算得多,所以为了测试,直接开了一个。
没开的时候, 我买了1000万tokens包(够写《三国演义》200 遍), 但测了10个例子就用完了。。代码场景的上下文还是太大了)。
我们测试案例分为:涉及数据库的、网站、Game等。
邀请码,听到这个名字,稍微有一股讨厌的味道。很多ai产品内测,疯狂整这个玩意儿。
内测产品、公测前预热,既要反刷也要让用户看到“我在涨”。让我们结合supabase实现一下。
提示词:
使用supabase mcp,新建一个supabase 项目,然后完成数据库表。完成下面这个任务:
“邀请制”病毒式等待名单 + 实时榜单 Aha 时刻
不用后端框架,直接在 Supabase 做“邀请码 + 实时排行榜”,一晚做完拉新闭环。
适用痛点
内测产品、公测前预热,既要反刷也要让用户看到“我在涨”。
Prompt
"""
实现“等待名单 + 邀请积分”:
表:waitlist_signups(id uuid pk, email citext unique, referral_code textunique, referrer_code text, points int default 0, created_at timestamptz);referrals(id uuid pk, invitee uuid fk, referrer_code text, created_at timestamptz)。
逻辑:新用户注册→分配唯一 referral_code;被邀请注册→referrer 积分+10;被邀请者完成首个关键动作(用 events表)→再加分。
物化视图 leaderboard 或视图:前 100 名(email 打码显示)。
RLS:仅本人可看自己的排名详情;公共端可读前 100 名脱敏数据。
Realtime:订阅 leaderboard,前端看到自己排名实时变动。
边界:防重复邀请刷分:referrals(unique(invitee));事件去重(event_id unique)。
Edge Function(可选):POST /join 接收 email & 可选 referrer_code,事务内完成注册与积分。
自测:1)重复 email 被拒;2)同一 invitee 多次不会重复加分;3)排行榜实时刷新。
交付:SQL 迁移、RLS、视图/物化视图刷新、Edge Function、前端订阅示例。
"""
验收要点
反刷健壮、排行榜稳定、RLS 不泄露隐私。
需要有一个前端,让我好测试。
其实提示词已经说的很简单了。实现“等待名单 + 邀请积分”:然后我告诉他验收要点。 所以我觉得这也是一个经验吧。在提示词里加入验收要点。
而且我感觉这次的提示词写得很“压缩”,就是信息浓度高。
这个提示词是我的想法结合 gpt5-high 优化出来的。不得不说 gpt5-high这个模型真的很强,它输出的很多文字都很压缩、精炼。
比如在涉及到「表设计」的部分,如果我们没有这个认知,自己可能写不出这样的提示词;但它能把复杂的表述压缩成几个字,却包含了我们以前需要一整句话才能说清的东西。
这种“压缩型提示词”,如果用得好,确实能提高我们和 AI 协作写代码时的效率。
好了,我们来看看测试结果吧。GLM4.5 第1轮提示完它基本上就把所有的完成了。并且测试都ok。
不过在他给我的前端网页中还是有注册的问题。
后续我提示了两轮。问题都解决了。
我们可以使用自己的邮箱先注册。然后获得推荐码。当第2个人注册并且使用我们推荐码的时候,我们会获得10个积分。在上面这个视频中,最终你可以看到outlook这个邮箱以20分排名第一,并且在视频末尾你可以看supabase数据库,记录了所有发生的一切。
在这个案例中,GLM 4.5表现的不错,调用了Supabase mcp去supabase里创建项目、设计数据库结构、创建表等等。
另外,Claude Code做得比较好的事。在你提交一个提示词之后。你等待的过程中,它在界面可以显示一些使用它的小技巧。类似于游戏加载页面给你的游戏技巧。
然后在测试过程中。我也尝试了在不同环境中使用Claude Code,比如本机Windows、本机macos、远程Linux。
像Claude Code、Aider这样的终端ai编码助手。比Cursor这样的好的一个优势点在于,Windows 下使用Claude Code,他调用终端去执行操作,基本没有什么阻拦,他能比较好的运行Windows终端命令等。
而Cursor这样的可能有时候受限于Windows 终端命令,会让你卡住的样子,没有macos里顺滑,有时候还得担心一些mcp不能像在macos里那样完美使用。
不过,Windows 里给Claude Code配置mcp确实有一些坑。我们文末再说。
用纯 Supabase 实现「一次性查看」,没有第三方服务、连“第二次看都不行”。 适用痛点: 发临时密码、Invite 链接、一次性密钥,既要安全又要快捷。
Prompt(投喂模型)
"""
你是 Supabase 后端工程师。实现“阅后即焚密钥分享”:
表:secrets(id uuid pk, owner_id uuid, token_hash bytea unique, ciphertext, allowed_views int
default 1, used_count int default 0, expires_at timestamptz, destroyed_attimestamptz,
created_at timestamptz default now()); secret_views(id uuid pk,secret_id uuid fk, viewer_ip
inet, viewed_at timestamptz default now())。
扩展:CREATE EXTENSION IF NOT EXISTS pgcrypto; 使用 digest(token,'sha256')存 token
哈希,绝不落明文。
安全:开启 RLS;secrets 仅 owner 可管理元数据;任何人不可直接 SELECT cipher。
RPC:create_secret(plain text, allowed_views int, expires_at timestamptz)返回一次性
token(随机 32 bytes base64);内部完成加密(可用 pgp_sym_encrypt)+ 写入 token_hash。
RPC:consume_secret(token text) 原子读取并“核销”:单事务内 UPDATE ... WHEREtoken_hash=... AND
used_count<allowed_views AND (expires_at IS NULL OR expires_at>now())AND destroyed_at IS NULL
RETURNING cipher;成功则 used_count+1、插入 secret_views;若视图次数用尽或过期则把destroyed_at
设为 now()。
Edge Function(可选):GET /s/:token → 调用 rpc.consume_secret 并返回明文,第二次访问必须404。
RLS:允许 anon 调用 consume_secret,但不能旁路读取任何行;所有表行级策略严格。
自测:1)创建密钥→第一次访问成功,第二次访问 404;2)并发 10 次只成功 1
次;3)过期后不可读;4)owner 可看到被谁在何时查看(secret_views)。
交付:SQL 迁移、RLS 策略、两个 RPC 函数、Edge Function 代码、supabase-js 测试脚本(含并发读)。
"""
验收要点
并发“只烧一次”,无脏读;token 明文从不落库;RLS 不可旁路。
GLM,也是一次性做好。
这个测试两个模型都做好了,deepseek 3.1:
我让他分析一下我的提示词网站,让它集成订阅支付功能:
先分析一下我们的项目。然后我们开发新的功能。
任务:为网站集成Stripe订阅支付功能
先使用supabase mcp完成登录注册,使用supabase里的aitraineeg4@gmail.com's Project,再集成 Stripe 订阅支付
在这个任务中,基本的排名情况是。claude>glm4.5>deepseek
claude我只提示了两次,第1次是集成支付的提示词。第2次是告诉他报错。
设计一个Prompt交易平台的数据库,要求:
1. Prompt模板的分类和标签系统
2. 使用次数统计和用户评价
3. 付费Prompt的购买记录
4. Prompt版本管理和更新通知
5. 简单的创作者收益结算
6. API调用记录和Token统计
连接好输入supabase mcp后,我们可以看到后台的效果。gim4.5设计的不错
地图随机生成;玩家需在巡逻卫兵视野外到达出口。
可见性:从卫兵位置做光线扇形投射(Ray casting),阴影软缘(距离衰减 alpha)。
UI:地图大小/卫兵数量/视野角度;暂停/步进。
视觉:光锥、阴影、警报闪烁;音效可选(纯 WebAudio)。
"""
验收
光锥与墙体交界平滑;碰撞判定准确
加分
声音诱饵(投掷石子引开卫兵)
deepseek:
这是glm的:
两个游戏都能玩。但地图大小设置那里都有bug。其他功能都正常。不过从音效画面表现来看glm略胜一筹。 【键盘音效DJ台】
【键盘音效DJ台】
实现一个打字变DJ的工具:
效果:每个按键对应不同音效和视觉
- ASDF对应鼓点
- QWER对应旋律
- 空格是drop the beat
- 数字键切换音效包
- 打字自动生成beats
炫酷指数:
- 键盘按下产生霓虹光波
- 音频频谱实时可视化
- 录制你的"代码DJ秀"
GLM:很有意思的一点是可以点击开始录制,然后结束后它会播放我们打过的按键:
deepseek这个从功能上来说,它其实更符合我们的提示词。唯一的问题也是最大的问题,就是根本用不了,是bug。
glm他生成的代码音效特效配合方面比deepseek好
吃豆人变成丧尸感染游戏:
玩法颠覆: - 开始只有一个鬼,吃到吃豆人后被感染变鬼 - 吃豆人要合作生存尽可能久 - 大力丸变成疫苗(临时免疫)- 地图会逐渐崩塌,活动空间越来越小 - 最后一个幸存者获胜 多人混战: - 支持16人同时游戏 - 被感染后立即加入鬼阵营
基本上deep seek总是在画面对应提示词上会好一些,如果不出bug的话。但是从ui表现来说,glm会更胜一筹,那种舒适感。一个偏向古典,一个偏向现代化组件。
这些创新玩法的游戏。一方面让测试更有趣,另一方面也考虑可能是模型没有训练到的。
在3D空间玩2048:
玩法突破: - 6个面的立方体,每面都是2048 - 可以旋转立方体,让数字"掉"到另一面 - 相邻面的边缘数字可以合并- 特殊玩法: * 整个面翻转 * 对角线移动 * 黑洞格子(吸收周围数字) 视觉震撼:- 立方体可以自由旋转查看 - 合并时的3D粒子效果 - 达到2048某个面会发光
Deepseek看起来是那么样子,但也玩不了。
GLM:bug了
扮演NPC过完整人生:
扮演NPC过完整人生:
NPC视角:
1. 日常生活:
- 开店经营
- 种田养殖
- 铁匠锻造
- 守卫巡逻
2. 冒险者互动:
- 定价卖道具给玩家
- 发布任务
- 提供情报(真假自定)
- 被抢劫时的选择
3. 人生轨迹:
- 结婚生子
- 职业转换
- 年老退休
- 培养继承人
4. 改变世界:
- NPC也能影响主线
- 组织NPC起义
- 建立商业帝国
深度体验:
- NPC之间的复杂关系网
- 小人物的史诗
- 平凡生活的意义
这个测试还是挺有意思的。 GLM模拟的这个 npc过完整个人生还是挺不错的。可能也和gem可以自主思考有关。视频的后半部分是deepseek写的,明显简略很多。
Make me a memory game where i have to flip pieces to match 2 - make it for a toddler - so bright and with simple shapes
有点离谱,deep seek做的这个竟然是明牌的。。
Gim这个做就是正确答案了。并且感觉它的特效音效配上都比较融洽。这是他的一个优点。他几乎总是美观度和音效方面配合的比较好,我们文后的例子也可以看到他的这一点。
接着让他们以编程的方式玩我的世界。glm UI更加偏向于现代的这些前端组件的效果。 deepseek功能没有实现完。glm的更好
把马里奥改造成物理建筑游戏:
把马里奥改造成物理建筑游戏:
核心玩法:
1. 马里奥不再是跳跃闯关,而是:
- 用管道搭建水路系统
- 砖块有真实物理属性(会倒塌)
- 造桥让其他角色通过
- 建造防御工事抵御库巴军团
2. 建筑材料系统:
- 问号砖:随机材料
- 金币购买钢筋水泥
- 蘑菇:让建筑"生长"
- 火花:焊接金属结构
3. 物理引擎考验:
- 地震测试(库巴跺脚)
- 水压测试(水管爆裂)
- 承重测试(胖子Mario走过)
4. 关卡目标:
- 建造通天塔救公主
- 修复被破坏的蘑菇王国
- 造船渡过岩浆海
创意亮点:
- 每个建筑都可以保存分享
- 其他玩家可以来"参观"你的王国
- 建筑倒塌的慢动作回放
glm:
deepseek功能上又出现了bug:
创新玩法:
六边形网格,6个方向移动(比传统4方向更刺激)
支持10条蛇同时对战
吃到食物不仅变长,还能获得技能
瞬移:穿过自己的身体
分身:临时分成两条小蛇
护盾:撞墙不死一次
地图逐渐缩小的毒圈机制
死亡后变成障碍物影响其他玩家
视觉亮点:
每条蛇都有独特的皮肤效果(霓虹、像素、彩虹)
吃到食物的粒子爆炸效果
碰撞时的慢动作回放
deepseek:bug,玩不了
Build a single-serving site in an ironic–spiritual style that answers one simple question: “Is Mercury in retrograde?” The tone should be mystical-meets-sarcastic – think crystals meet glitch. Use animations to bring it to life – maybe constellations jittering, planetary vibes shifting, or a cosmic spinner. Surprise me. Make it weird. Make it magical. Make it a little too much.
# 指令:将以下源文本转化为一个【极简主义美术馆】风格的交互式网页。
## **第二部分:核心叙事与设计规范** - **叙事哲学:** 精炼、本质、宁静。AI需将文本提炼成最精简的“展品”——可能是一个词、一句话或一个数据。 - **布局逻辑:** 放弃传统的Bento Grid。整个页面是一个巨大的、空旷的“展厅”。信息点作为“展品”稀疏地分布在空间中。 - 屏幕中央可能只有一个超大号的词语。 - 右下角可能是一小段精炼的文字。 - 滚动页面时,旧的“展品”淡出,新的“展品”以优雅的动画进入空旷的视野。 - **美学:** 极致的留白。纯白 (`#FFFFFF`) 或极深的灰色 (`#111111`) 背景。所有文字只用一种完美的字体(如 Helvetica Neue Light),一种颜色。无边框,无装饰。 - **动效:** 使用Framer Motion。所有动效都必须是缓慢、平滑的淡入淡出。 - **通用技术规范:** 使用HTML5, TailwindCSS 3.0+ (均通过CDN引入)。关键在于对空间和节奏的控制。
视频前半部分是deepseek,后半部分是GLM
两个模型都很好的遵循了提示词的要求。如果硬要从个人角度来说的话,我会喜欢DEEPSEEK的,他所采用的字体更好看。
第一种方法:使用官方提供的Claude Code接入接口
基本上智谱和deepseek都提供了,智谱的接入方法在这篇文章末尾:
GLM-4.5 发布,六大主流模型混战测评,谁能一键生成“ 真·可用 ”的应用?
deepseek的在这:腾讯 CodeBuddy 国内版公测,DeepSeek-V3.1免费;Claude Code 可以直接用 DeepSeek了
第二种方法:使用https://github.com/musistudio/claude-code-router 项目接入GLM、DEEPSEEK、K2、Gemini这些模型进Claude Code。
这两种方法我都测试过。官方提供的接口模型响应速度,稳定性都比较高。测试过程中没有出现中断的现象。
而第2种方法,我使用硅基流动的和openrouter提供的GLM4.5与Deepseek 3.1在测试过程中经常可能出现api调用频率过高或者上下文太长。直接红温。
openrouter 有免费的模型
硅基流动注册就送额度:国内版15元,国外版1美元。
使用第二种方法的好处是,可以给刚刚不熟悉Claude Code的朋友,无顾虑的使用Claude Code,等熟悉了,可以再转其他的。并且第2种方法也不需要考虑网络问题。
好的,那我们来看一看第2种方法的安装。
首先,请确保您已安装 Claude Code:
npm install -g @anthropic-ai/claude-code
此外,还有以前相关的安装文章:
Claude Code 一键安装来了,包含API接入、常用工作流、MCP配置、用量监控
Claude Code 快速入门,高频使用点 + 生态工具,一篇搞定!
然后,安装 Claude Code Router:
npm install -g @musistudio/claude-code-router
装好后以:ccr code --dangerously-skip-permissions 启动,--dangerously-skip-permissions 表示给予最大权限。不需要每次都同意。
如果你想要继续上一次的对话:ccr code -c --dangerously-skip-permissions
或者去历史对话中选择一个对话:ccr code -r --dangerously-skip-permissions
我在测试的时候一般会先在本地建一个总的文件夹。在提供测试例子的时候。通常会在前面加一句,让他新建一个项目文件夹,这样有利于隔离。
然后一次性跑四五个以上的例子。有多少个例子就开多少个窗户。然后你就可以看到整个屏幕有许多Claude Code同时在跑:
Windows现在一直在保持更新,有些东西倒是越来越好用。有些地方还加入了copilot,这个power shell,你可以点击旁边的复制标签。新标签以ccr code --dangerously-skip-permissions 再启动一次即可。
启动后,我们打开:http://127.0.0.1:3456/ui/,你就可以在这里配置你想用的模型提供商。
选择供应商之后,你只要把api key和你想用的模型填进去就行了。并把供应商转换器选择为Anthropic。
你可以一次性添加很多供应商。
添加完供应商之后,你可以在右边的claude code路由里选择不同功能使用的何种模型。可以各大供应商混合使用。
你可以在用户名路径下C:\Users\Aitrainee\.claude-code-router找到配置文件。后续迁移都可以直接复制这个配置文件,而不需要从界面一个个点。
这里需要注意的是。你运行的任何一个以ccr code启动的窗口退出了,claude-code-router服务也会中断。所以如果你有一个窗口不用了。不需要“ctrl + c”推出,而是直接×掉
每次在前端更改模型配置的时候,记得保存更新重启:
上下文阈值也可以设置一下。deppseek官方建议60000,太大了,可能api会又报错误。
这里有些平台可以免费使用模型,后台回复 glmcc 即可:
Claude code 在Windows下安装mcp,需要注意以下几个:
你需要使用claude mcp add命令安装,还需要把node.exe路径、mcp包执行路径、涉及环境变量如api key的mcp的变量形式写对。
基本上就和以前windows cursor 安装失败一样的道理Windows下MCP报错的救星来了,1分钟教你完美解决Cursor配置问题。
你先需要知道。claude code mcp的配置信息是放在这个.claude.json文件里的,用“mcpServers”搜索一下会发现两个配置的地方,按顺序第一个是项目级,第二个是用户全局。我一般直接滑到末尾配置这个全局的。
以这两个安装为例。直接运行下面的命令即可。
claude mcp add --scope user context7 cmd -- /c "npx @upstash/context7-mcp"
但有些mcp用这种方式你可能会报错,所以:
尽量先全局安装你的mcp,并且找到你安装的位置(注意这些环节的工作都可以交给ai完成,比如cursor agent):
claude mcp add --scope user playwright-mcp "C:\\nvm4w\\nodejs\\node.exe" -- "C:/Users/Aitrainee/AppData/Roaming/npm/node_modules/@playwright/mcp/cli.js"
状态: ✅ Connected
说明: 使用完整路径方式,需要先全局安装 npm install -g @playwright/mcp
还有些mcp有环境变量,这里以supabse为列:
claude mcp add --scope user supabase "C:\\nvm4w\\nodejs\\node.exe" -e SUPABASE_ACCESS_TOKEN=sbp_cbda38640a8 -- "C:/Users/Aitrainee/AppData/Roaming/npm/node_modules/@supabase/mcp-server-supabase/dist/transports/stdio.js"
这是几个常用mcp最终在文件的样子:
我整理了份文档。公众号后台回复:windows ,获取claude code windows安装实践指南。
此外,在这次测试中,我有些经常使用的命令:
你可以再项目下创建一个Claude.md,并且填入让他用中文回答。
进去claude code后,你可以用“/”,CC会在后面列出有哪些可用的命令并且右边还有注释。试着一个一个去玩一下。
我使用第一种方法给CC接入模型,通常会复制其中一组命令,快速打开。
1:windows cmd
set ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic
set ANTHROPIC_AUTH_TOKEN=
# 启动Claude
claude --dangerously-skip-permissions
2:windows powershell
# 正确设置环境变量(PowerShell语法)
$env:ANTHROPIC_BASE_URL = "https://open.bigmodel.cn/api/anthropic"
$env:ANTHROPIC_API_KEY = ""
# 启动Claude
claude --dangerously-skip-permissions
3:linux / mac
export ANTHROPIC_BASE_URL=https://open.bigmodel.cn/api/anthropic
export ANTHROPIC_AUTH_TOKEN=
# 启动Claude
claude --dangerously-skip-permissions
测试过程中。GLM的速度会比Deepseek快些。
GLM4.5价格(每百万):输入2元,输出8元,
Deepseek:贵些。
GLM4.5 和其他模型比对
此外,我们前面一篇文章也有看过glm的排名情况,在两个实测平台的榜单都占据前位。
Cursor只排第6!136国用户实测25款AI编码工具,第一名73%胜率,还是个新面孔
如果不使用Claude,考虑性价比,我可能会选择GLM4.5 + Claude Code。
以上。
点击下方“阅读原文”可直接获取GLM + Claude Code代码编程专享计划 20元包月活动,价格也确实很优惠了,性价比高。
🌟 知音难求,自我修炼亦艰,抓住前沿技术的机遇,与我们一起成为创新的超级个体(把握AIGC时代的个人力量)。
点这里👇关注我,记得标星哦~