首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

HAWQ:基于 Hessian 的混合精度神经网络量化

在许多应用程序中部署神经网络时,模型大小和推理速度/功率已成为主要挑战。解决这些问题的一种有前途的方法是量化。但是,将模型统一量化为超低精度会导致精度显着下降。一种新颖的解决方案是使用混合精度量化,因为与其他层相比,网络的某些部分可能允许较低的精度。但是,没有系统的方法来确定不同层的精度。对于深度网络,蛮力方法不可行,因为混合精度的搜索空间在层数上是指数级的。另一个挑战是在将模型量化到目标精度时用于确定逐块微调顺序复杂度是阶乘级别的。本文介绍了 Hessian AWare 量化(HAWQ),这是一种解决这些问题的新颖的二阶量化方法。HAWQ 根据Block块的 Hessian 最大特征值选择各层的相对量化精度。而且,HAWQ基于二阶信息为量化层提供了确定性的微调顺序。本文使用 ResNet20 在 Cifar-10 上以及用Inception-V3,ResNet50 和 SqueezeNext 模型在 ImageNet 上验证了方法的结果。将HAWQ 与最新技术进行比较表明,与 DNAS 相比,本文在 ResNet20 上使用 8 倍的激活压缩率可以达到相似/更好的精度,并且与最近提出的RVQuant和HAQ的方法相比,在ResNet50 和 Inception-V3 模型上,当缩小 14% 模型大小的情况下可以将精度提高 1%。此外,本文证明了可以将 SqueezeNext 量化为仅 1MB 的模型大小,同时在 ImageNet 上实现 Top-1 精度超过 68%。

02
您找到你想要的搜索结果了吗?
是的
没有找到

CAS2023——脑动脉分割挑战赛

中风是全世界死亡的主要原因之一。缺血性中风的主要病因是脑血管疾病,其特征在于脑血管系统疾病,例如动脉狭窄和闭塞。准确评估脑血管疾病对于脑血管疾病的诊断、治疗和干预具有重要意义。磁共振血管造影(MRA)广泛用于可视化脑动脉树以进行疾病诊断。MRA准确的脑动脉分割对于脑血管疾病的定量分析,如估计管腔狭窄程度具有重要意义。然而,考虑到脑动脉网络复杂、个体间差异很大,并且由于血流缓慢或平面内血流导致小血管信号较弱,即使对于专家来说,手动分割也具有挑战性。飞行时间 (TOF) MRA 是最广泛使用的非侵入性成像技术,无需使用造影剂即可描绘脑血管树的解剖结构。

01

ICLR 2022丨加速无数据量化数万倍,上海交大&微软提出无数据场景下毫秒级量化方法SQuant

作者丨‍郭聪 邱宇贤 冷静文 高孝天  张宸 刘云新 杨凡 朱禺皓 过敏意 神经网络模型量化是提高神经网络计算效率的一个有效方法,它通过将模型参数转换成内存开销更小的低精度数据格式来减少计算与内存开销。经典的神经网络量化方法通常需要经过一个精调的训练过程,以保证量化后的模型精度。然而,出于数据和隐私安全的考虑,许多应用场景无法获得精调所需训练数据,因此无数据(data-free)场景下的量化算法成为当下研究热点之一。现有的无数据量化方案通常需要生成伪数据,然后利用伪数据进行训练后量化(Post-train

02

不走分成模式的搜狐却吸引了32万自媒体,2017年打算怎么干?

正如我之前多篇文章所言,移动互联网之后,智能互联网、内容互联网和实体互联网已然来临,门户是内容互联网的重要玩家,然而最近一年,今日头条、一点资讯们声名鹊起,张一鸣更是成为与王兴、程维齐名的新生代领袖(TMD),再加上如火如荼的短视频和直播风潮,门户的压力还是很大的。腾讯推出天天快报迎接新内容时代;新浪孕育出的微博在转型内容平台之后市值扶摇直上突破100亿美金;凤凰则有一点资讯。 新内容时代,搜狐的思路是怎样的?11月22日,2017搜狐World大会在广州召开,从这个大会上可以窥见搜狐这一老牌门户在内容互

07
领券