

Ollama 在 2025 年 9 月 21 日发布 v0.12.1 预发布版本,并在 9 月 24 日正式发布。本次更新不仅带来了全新的 Qwen3 Embedding 模型,还在工具调用、云模型交互、Linux 平台登录等方面进行了优化和修复,是一次功能与稳定性同步提升的重要版本。
cloud.md 文档并上线云模型功能,用户可在没有高性能 GPU 的情况下运行超大模型,如:gpt-oss:20b-clouddeepseek-v3.1:671b-cloudqwen3-coder:480b-cloud
云模型可以通过 ollama run 或 ollama pull + ollama signin 来使用。rope.scaling.factor(错误设为 8)被修正为正确值(1)。& 时解析失败的问题。ollama signin 登录问题修复
改进了私钥读取与公钥获取逻辑,修复 Linux 下无法正确登录的情况。encodedKey 参数,操作更简化。AuthorizationError 增加了 signin_url 字段,允许直接显示登录链接。signin_url 的解析与输出,便于快速跳转认证。本版本在集成测试方面做了大量调整:
blueSkyPrompt(包含简短事实性回答要求),并维护统一的 blueSkyExpected 响应关键字列表。TestParallelGenerateWithHistory 与 TestParallelChatWithHistory,在多个并行会话中验证上下文延续性。OLLAMA_TEST_ARCHITECTURE 环境变量,过滤与当前运行架构不匹配的模型。Harmony 消息处理器(HarmonyMessageHandler)新增功能:
HasToolSupport 与 HasThinkingSupport 接口,实现工具调用与思维链内容同步支持。这对于高级多工具交互的 AI 应用场景非常实用,例如自动化代码生成、数据管道处理等。
Ollama v0.12.1 是一次功能与稳定性均有提升的版本,亮点包括:
对于正在使用 Ollama 进行大模型开发与部署的用户,这次版本更新值得立即升级体验。
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。