
嗨,我是小华同学,专注解锁高效工作与前沿AI工具!每日精选开源技术、实战技巧,助你省时50%、领先他人一步。👉免费订阅,与10万+技术人共享升级秘籍!

WeClone 是一个通过微信(WeChat)或 Telegram 聊天记录微调大语言模型(LLM),打造你的专属数字分身的完整解决方案。支持文本、图片等多模态数据,经过预处理、训练、部署后,你的 AI 角色不仅「会说你的话」,还能「像你一样说话」,还能绑定到聊天机器人中使用 。
WeClone 正是针对这些痛点,为开发者和个人用户提供:
功能亮点 | 描述 |
|---|---|
聊天记录导入与过滤 | 支持从微信、Telegram 导出聊天文本与图像,自动过滤敏感信息 |
数据预处理与格式标准化 | 提取聊天内容、清洗噪声、转换为微调所需格式 |
LLM 微调训练 | 使用 ChatGLM3‑6B 等模型微调,使输出风格高度贴合用户语气 |
语音克隆(WeClone‑audio) | 将微信语音作为音频训练素材,使机器人“听起来像你” |
机器人绑定与部署 | 支持 Telegram、WeChat、QQ、企业微信、飞书等平台 |
隐私保护机制 | 所有处理在本地完成,不上传聊天记录;支持类别敏感信息剔除与个性化设置 |

类别 | 优势说明 |
|---|---|
模型选择 | 默认 ChatGLM3‑6B 模型,支持中文双语交流,部署门槛低 |
隐私保护 | 数据全流程本地化处理,不上传云端 |
语音还原 | 微信语音克隆,机器人声音更真实 |
平台覆盖广 | 支持 WeChat、Telegram、QQ、企微、飞书等,支持后续扩展 |
使用简便 | 提供导出、清洗、训练、部署脚本,适合非机器学习专业用户 |
⚠ 此部分展示 WeClone 核心使用截图和界面示例,按照 README 中顺序原样保留

项目 | WeClone | 类似 AI 聊天助手(如 Replika 或 ChatGPT 插件) |
|---|---|---|
个性话语言训练 | ✅ 支持好友聊天记录训练 | ❌ 多为通用大模型,对你不具备专属风格 |
语音克隆 | ✅ 高保真度克隆 | ❌ 多为标准语音,不贴合个人声纹 |
隐私控制 | ✅ 本地处理 + presidio 过滤 | ❌ 多依赖云端,隐私难掌控 |
集成平台 | ✅ WeChat、Telegram 支持 | ❌ 云助手平台,各自封闭 |
模型优化 | ✅ 支持 LoRA、qwen3、ChatGLM3 | ❌ 模型固定,无法训练 |
# 克隆项目
git clone https://github.com/xming521/WeClone.git
cd WeClone
# 创建 Python 环境
python3.9 -m venv .venv
source .venv/bin/activate # Linux / Mac
.venv\Scripts\activate # Windows
# 安装依赖
pip install -e .# 导出微信聊天记录(示例路径)
python weclone/data/chat_parsers/wechat_parser.py \
--wechat-data-dir "/path/to/WeChat Files/你的账号"
# 预处理隐私数据
weclone preprocess --input ./dataset/wechat --output ./training_data
# 微调模型
weclone train \
--model qwen‑3‑b \
--data ./training_data \
--lora
# 语音克隆训练(使用 5 秒样本)
weclone train‑voice --voice‑sample voice0.wav
# 部署到机器人
weclone deploy --platform wechat --bot astrbot这样,你的数字分身就能在微信中自动应答文字和语音了,而且风格接近你本人!
WeClone 是一个 适合个人与企业用户 的开源项目,它以 微信聊天记录为训练素材,通过 LLM 微调 + 语音克隆 技术,生成极具个性化的聊天机器人。支持微信、Telegram、QQ、飞书等平台,所有数据处理过程都在 本地完成,既保护隐私又让机器人“说话像你”。

https://github.com/xming521/WeClone
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。