WorkBuddy 作为腾讯出品的桌面级 AI 助手,真正强大的地方在于它不仅可以用云端模型,还支持完全离线的本地模型。配置好之后,日常使用零积分消耗,非常适合积分有限的用户。
本文将手把手教你:如何在本机部署 Ollama 本地大模型,并接入 WorkBuddy,实现完全离线使用 AI 助手。
对比项 | 云端模型 | 本地 Ollama 模型 |
|---|---|---|
积分消耗 | 有(按 Token 计费) | 零消耗 ✅ |
网络要求 | 必须联网 | 完全离线 ✅ |
数据隐私 | 上传云端 | 数据不出本机 ✅ |
响应速度 | 依赖网速 | 本地推理,稳定 ✅ |
结论:本地模型 + 云端模型组合使用,是最省积分的方案!
按 Win + R,输入 cmd,打开命令行,运行:
bash
复制
ollama --version看到版本号输出,说明安装成功 ✅
Ollama 支持拉取各种开源大模型,以下是我亲测适合不同配置的选项:
模型 | 内存占用 | 推荐配置 | 中文能力 |
|---|---|---|---|
qwen3:4b | ~2.5GB | 8GB 内存 ✅ | ⭐⭐⭐⭐⭐ 最佳 |
qwen3:8b | ~5GB | 16GB 内存 ✅ | ⭐⭐⭐⭐⭐ 最佳 |
llama3.2:3b | ~2GB | 8GB 内存 ✅ | ⭐⭐⭐ 一般 |
phi3:3.8b | ~2.3GB | 8GB 内存 ✅ | ⭐⭐⭐ 一般 |
推荐:中文用户首选
qwen3:4b(通义千问),中文理解能力最强!
在命令行运行(以 qwen3:4b 为例):
bash
复制
ollama pull qwen3:4b拉取完成后,测试一下:
bash
复制
ollama run qwen3:4b "你好,介绍一下你自己"看到模型回复,说明一切正常 ✅
http://localhost:11434qwen3:4b(与你拉取的模型名一致)配置完成后,在 WorkBuddy 对话界面的模型选择器中,选择你配置的 qwen3:4b (Ollama),即可开始离线对话!
问题 | 说明 |
|---|---|
本地模型能力上限 | 4B 模型适合日常使用,复杂任务建议切换云端 |
Ollama 需常驻后台 | 使用本地模型时,Ollama 必须在后台运行 |
首次拉取需联网 | 模型只需下载一次,之后完全离线 |
内存建议 | 8GB 内存用 4B 模型,16GB 推荐用 8B 模型 |
我的配置:
qwen3:4b,流畅无压力 ✅升级建议:如果你的内存只有 8GB,建议升级到 16GB(约 ¥100-150),可以运行更大的 8B 模型,效果提升明显!
通过 Ollama + WorkBuddy 的组合,你可以:
配置过程只需 10 分钟,但省下的积分非常可观。希望这篇教程对你有帮助!
如果你觉得有用,欢迎点赞收藏,也欢迎在评论区分享你的配置经验!
#WorkBuddy #本地模型 #Ollama #零积分 #AI助手 #教程
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。