Qwen3-235B-A22B 在 Aider 多语言编码基准初步测试中击败了 Sonnet 3.7 Thinking 和 OpenAI o1,同时成本还便宜了 150 到 600 倍!
Qwen3-32B 的准确率达到了 45.8%,超越了 GPT-4.5 和 GPT-4o,且代码编辑格式的正确率保持在 100%,而 GPT-4.5 和 GPT-4o 的格式正确率分别为 97.3% 和 64.4%。
分享快讯到朋友圈