知识蒸馏：让大模型“瘦身”的魔法

六月的雨在Tencent

修改于 2025-04-09 16:00:44

8240

概述

什么是蒸馏模型？AI界的“知识浓缩术”核心定义蒸馏模型（Distillation Model）是一种通过“师生教学”的方式，将庞大复杂的大模型（教师模型）中的核心知识，“浓缩”到轻量级小模型（学生模型）中的技术。就像把百科全书提炼成便携手册，既保留关键知识，又大幅降低使用门槛。传统训练 vs 知识蒸馏传统训练：学生模型直接从数据中学习（如同自学），需要大模型自己从海量数据中提取自己需要的信息；知识

文章被收录于专栏：创作是最好的自我投资创作是最好的自我投资

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

论文共读