前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >从0开始训练一个大模型,跑通chatgpt所有流程

从0开始训练一个大模型,跑通chatgpt所有流程

原创
作者头像
用户11249147
发布2024-08-19 12:04:17
1740
发布2024-08-19 12:04:17

今天介绍一个我的开源项目:Zero-Chatgpt(https://github.com/AI-Study-Han/Zero-Chatgpt)。

这个项目包含从1、数据收集 -> 2、数据清洗和去重 -> 3、词表训练 -> 4、语言模型预训练 -> 5、指令微调 -> 6、强化学习(rlhf,ppo)所有需要的数据(环境)介绍、运行脚本和代码,并且兼容huggingface格式。如果需要的话可以直接联系作者,运行的镜像也可以直接提供。根据这个项目,你只需要收集自己的数据就可以直接跑一个你自己的大模型,可以根据你自己手边的计算资源自由的缩放模型和数据大小。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档