首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >ollama v0.12.1 更新详解:新增 Qwen3 Embedding、云模型支持与多项功能修复

ollama v0.12.1 更新详解:新增 Qwen3 Embedding、云模型支持与多项功能修复

作者头像
福大大架构师每日一题
发布2025-12-18 13:04:43
发布2025-12-18 13:04:43
2650
举报

一、版本概述

Ollama 在 2025 年 9 月 21 日发布 v0.12.1 预发布版本,并在 9 月 24 日正式发布。本次更新不仅带来了全新的 Qwen3 Embedding 模型,还在工具调用、云模型交互、Linux 平台登录等方面进行了优化和修复,是一次功能与稳定性同步提升的重要版本。

二、核心更新内容

1. 新增模型

  • Qwen3 Embedding 高性能的开源向量嵌入模型,由 Qwen 团队提供,适用于搜索、推荐、语义匹配等任务。

2. 新功能与支持

  • Qwen3-Coder 支持 Tool Calling 在代码生成和解析场景中,可以直接调用外部工具处理数据,提升自动化能力。
  • Harmony 消息解析器 Harmony 流式消息处理新增工具支持、思维链输出支持,可处理函数名映射,并在消息结束时完成工具参数解析。
  • Ollama 云模型支持 引入 cloud.md 文档并上线云模型功能,用户可在没有高性能 GPU 的情况下运行超大模型,如:
    • gpt-oss:20b-cloud
    • deepseek-v3.1:671b-cloud
    • qwen3-coder:480b-cloud 云模型可以通过 ollama runollama pull + ollama signin 来使用。

3. 主要修复与改进

  • Gemma3 QAT 模型 Rope Scaling 修复 官方 QAT 欠标定的 rope.scaling.factor(错误设为 8)被修正为正确值(1)。
  • Qwen3-Coder 在 Function Calling 解析 & 字符时的 Bug 修复 解决了在参数中出现 & 时解析失败的问题。
  • Linux 平台 ollama signin 登录问题修复 改进了私钥读取与公钥获取逻辑,修复 Linux 下无法正确登录的情况。
  • 连接状态提示优化 连接云模型时,客户端不再错误地显示 “connection lost”,提示逻辑更为准确。

4. API 变化

  • • 移除了部分 Signout 方法中的 encodedKey 参数,操作更简化。
  • AuthorizationError 增加了 signin_url 字段,允许直接显示登录链接。
  • • 流式 API 中新增对 signin_url 的解析与输出,便于快速跳转认证。

三、测试与质量保障更新

本版本在集成测试方面做了大量调整:

  1. 1. 统一蓝天测试提示词 将「why is the sky blue?」统一替换为更明确的 blueSkyPrompt(包含简短事实性回答要求),并维护统一的 blueSkyExpected 响应关键字列表。
  2. 2. 并行上下文测试
    • • 新增 TestParallelGenerateWithHistoryTestParallelChatWithHistory,在多个并行会话中验证上下文延续性。
  3. 3. 架构兼容测试
    • • 在执行模型测试时支持 OLLAMA_TEST_ARCHITECTURE 环境变量,过滤与当前运行架构不匹配的模型。
  4. 4. 性能测试改进
    • • 输出 CSV 格式性能数据,增加近似 PromptEvalCount 以方便跨版本对比。

四、Harmony 模块增强

Harmony 消息处理器(HarmonyMessageHandler)新增功能:

  • • 初始化阶段可重命名工具函数,避免命名冲突。
  • • 在流式解析过程中积累工具调用信息,并在消息完成时统一解析。
  • • 内置 HasToolSupportHasThinkingSupport 接口,实现工具调用与思维链内容同步支持。

这对于高级多工具交互的 AI 应用场景非常实用,例如自动化代码生成、数据管道处理等。


五、开发者与用户影响

  • 开发者:API 接口变化需要同步适配,尤其是 Signout 签名与 Tool Calling 的调用方式。
  • 用户:可以无需高性能 GPU 直接运行云端大模型,且在 Linux 平台登录更顺畅,交互体验更佳。
  • 模型使用者:Qwen3 Embedding 将提升搜索与语义任务的精度,Harmony 工具支持可以在复杂任务中带来更高的可扩展性。

六、总结

Ollama v0.12.1 是一次功能与稳定性均有提升的版本,亮点包括:

  1. 1. 上线 Qwen3 Embedding 与云模型,让硬件门槛大幅降低;
  2. 2. Harmony 工具支持与思维链功能完善;
  3. 3. 关键 Bug 修复,尤其是 Gemma3 Rope Scaling 与 Qwen3-Coder 解析问题;
  4. 4. 测试体系优化,为后续版本稳定打下基础。

对于正在使用 Ollama 进行大模型开发与部署的用户,这次版本更新值得立即升级体验。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-09-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 福大大架构师每日一题 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、版本概述
  • 二、核心更新内容
    • 1. 新增模型
    • 2. 新功能与支持
    • 3. 主要修复与改进
    • 4. API 变化
  • 三、测试与质量保障更新
  • 四、Harmony 模块增强
  • 五、开发者与用户影响
  • 六、总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档