首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ollama v0.6.3正式发布!Gemma 3长上下文推理速度飙升,还有这些硬核优化!

引言

Ollama 团队刚刚推送了 v0.6.3 版本,这次更新聚焦Gemma 3 性能优化用户体验提升,不仅解决了多个关键错误,还让长文本推理速度直接起飞!无论是开发者还是AI爱好者,这次更新都值得你立刻升级!

核心更新亮点

1.Gemma 3 长上下文性能暴增

• 新增滑动窗口注意力(Sliding Window Attention)优化,长文本推理速度更快,内存分配更高效,尤其适合处理超长文档或代码。

2.加载速度提升

• Gemma 3 模型加载时间大幅缩短,告别漫长等待!

3.智能模板适配

•ollama create命令现在能自动识别并适配 Gemma 3 的 Safetensors 格式,无需手动配置,开箱即用!

4.关键Bug修复

• 修复talloc->buffer_id和sched->hash_set.size报错问题,运行稳定性再升级。

•ollama show -v现在能正确显示布尔值(true/false),调试更直观。

开发者必看

兼容性提示:ollama create现在会明确返回不支持架构的名称,避免无效操作。

推荐动作:运行ollama update或前往官网下载最新版,即刻体验性能飞跃!

用户评价

“v0.6.3 的 Gemma 3 优化太顶了!之前处理 10K token 的代码总要卡顿,现在流畅得像换了台机器!”——某AI开发者

·

欢迎关注“福大大架构师每日一题”,让AI助力您的未来发展。

·

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OFw_HQFj4IDkjb3LINVElvTQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券