首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Additive Powers-of-Two (APoT) Quantization:硬件友好的非均匀量化方法

本文,在非均匀量化中通过采用Additive Powers-of-Two(APoT)加法二次幂量化,综合考虑了计算上有效性,低比特量化导致的模型精度下降问题。并实现了不错的量化效果!...论文题目:Additive Powers-of-Two Quantization: A Non-uniform Discretization for Neural Networks 论文链接:https...://arxiv.org/pdf/1909.13144v2.pdf 论文代码:https://github.com/yhhhli/APoT_Quantization 摘要 本文首先提出了Additive...方法 Additive Powers-of-Two量化 (APoT) ? 三种量化方法示意图 量化表示 代表裁剪阈值。 代表Clip函数,将权重裁剪到 。...Additive Powers-of-Two 量化表示 PoT 量化虽然十分适配基于钟型的weights形式,但是,对于增加bit数是没有明显增益。

2.8K42
领券