首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >腾讯云:率先支持DeepSeek全系模型精调与推理

腾讯云:率先支持DeepSeek全系模型精调与推理

作者头像
小腾资讯君
发布2025-02-20 21:26:15
发布2025-02-20 21:26:15
5560
举报

近日,腾讯云旗下TI平台宣布支持DeepSeek「全系模型」的企业级精调与推理,帮助开发者更好解决「数据预处理难」、「模型训练门槛高」、「在线部署及运维复杂」等问题。

此次支持能够为金融、医疗、制造、零售等多个行业提供更高效、更便捷的AI模型构建及应用方案,进一步降低企业在大模型应用中的技术门槛和研发成本。

目前,用户可以根据个性化需求,灵活使用两种精调模式:

//模式一:直接精调满血版DeepSeek

适用于希望直接对原始DeepSeek模型进行微调的用户,两步走即可完成精调。

● 步骤一:训练数据准备

在数据标注环节,可基于灵活Schema配置得到高度自定义的人工标注工作台,适配绝大多数标注场景;在数据构建环节,用户内置数据分析、清洗、去重、Prompt优化、格式转换等环节的代码脚本,支持用户灵活处理各类文本数据。

图片
图片
图片
图片

● 步骤二:一键发起模型精调

在“大模型广场”或者“任务式建模”模块选择DeepSeek模型;选择步骤一中准备的数据路径,设置学习率、迭代步数等参数,即可发起训练任务。支持全参和LoRA两种策略,供用户按需选择精调场景。

图片
图片

//模式二:基于DeepSeek R1蒸馏其他较小尺寸模型

适用于希望以更低成本、更高响应速度应用R1的用户。TI平台支持基于R1蒸馏其他较小尺寸模型,可将R1的能力迁移至较小尺寸的“学生”模型中。三步走迅速实现精调。

● 步骤一:部署DeepSeek-R1推理服务

在腾讯云TI平台的在线服务模块部署 DeepSeek R1推理服务,体验对话效果。

图片
图片

● 步骤二:基于 DeepSeek-R1 蒸馏数据

在数据构建模块中将原始训练数据集进行解析、清洗,然后调用DeepSeek R1生成高质量带长思维链的蒸馏数据,并对蒸馏数据再次进行分析、清洗、去重、Prompt优化、格式转换等环节,得到可用于训练的数据集。

图片
图片

● 步骤三:精调较小尺寸的“学生模型”

在“大模型广场”或者“任务式建模”模块选择Llama等其他较小尺寸的“学生模型”;选择步骤二中准备的数据路径,设置学习率、迭代步数等参数,即可发起训练任务。

图片
图片

为确保模型在实际应用中的稳定性与高效性,腾讯云TI平台还提供了全面的「模型评测」与「部署功能」,以全流程能力保障模型优化。

值得一提的是,TI平台同时支持公有云、私有化版本。其中,公有云版本在腾讯云上开箱即用,按需订阅;私有化版本可部署在客户本地机房、专属云服务器等自有算力上,更适合金融等更高数据安全要求的场景,从而灵活满足政府和企业的多样化需求。

快来腾讯云TI平台,训练一个属于你的专属模型吧!

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档