首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

ICLR 2022丨加速无数据量化数万倍,上海交大&微软提出无数据场景下毫秒级量化方法SQuant

作者丨‍郭聪 邱宇贤 冷静文 高孝天  张宸 刘云新 杨凡 朱禺皓 过敏意 神经网络模型量化是提高神经网络计算效率的一个有效方法,它通过将模型参数转换成内存开销更小的低精度数据格式来减少计算与内存开销。经典的神经网络量化方法通常需要经过一个精调的训练过程,以保证量化后的模型精度。然而,出于数据和隐私安全的考虑,许多应用场景无法获得精调所需训练数据,因此无数据(data-free)场景下的量化算法成为当下研究热点之一。现有的无数据量化方案通常需要生成伪数据,然后利用伪数据进行训练后量化(Post-train

02
领券