中小型公司大模型构建之路
•三天产生一个小应用
•两天产生一个新模型
•微软开发的开源深度学习优化库
•PyTorch框架
•优化器状态分区(ZeRO-1)
•梯度分区 (ZeRO-2)
•参数分区(ZeRO-3)
•1、训练一个原始模型,该模型具有较高的性能但运行速度较慢。
•2、确定哪些参数对输出结果的贡献较小,并将其设置为零。
•3、在训练数据上进行微调,以便尽量避免因网络结构发生变化而导致性能下降。
•4、评估模型的大小、速度和效果等指标,如果不符合要求,那么继续进行剪枝操作直至满意为止。
•非结构化剪枝
•使用技术A或B的一个或多个通道
•A 滤波
•B 权重矩阵
•分类
•权值剪枝
•神经元剪枝
•结构化剪枝
•又名:滤波器剪枝
•分类
•Filter-wise
•Channel-wise
•Shape-wise
•线性量化压缩
•非线性量化压缩