我使用torch.quantization.quantize_dynamic来缩小模型大小,但它降低了我的预测精度得分。
torch.quantization.quantize_dynamic
我正在使用该模型文件在瓶内,并做一些实时预测,因为我面临的问题,因为庞大的问题,同时预测。所以,谁能帮我减少伯特模型的尺寸,使用火把,并指导我做谁做实时预测。
发布于 2022-07-01 10:21:51
您是在重用现有的Bert模型,还是从零开始进行培训?
在所有情况下,您都可以对模型应用几种解决方案:
https://datascience.stackexchange.com/questions/112277
相似问题