腾讯云提供的云GPU服务器性能强大, 费用合理, 所以笔者试用腾讯云GPU云服务器完成了ViT模型的离线训练, 并记录了试用过程, 以供参考。...ViT模型简介
ViT的全称是Vision Transformer, 该模型由Alexey Dosovitskiy等人提出1, 在多个任务上取得SoTA结果。...在预训练状态下, 该结果对应的ground truth可以使用掩码的某个patch作为替代。
下面具体介绍使用腾讯云GPU服务器训练ViT模型的过程。...DALI的全称是Data Loading Library, 该库可以通过使用GPU替代CPU来加速数据预处理过程。...(我们也可以通过增加模型的参数量, 如修改模型为vit\_small\_patch16\_224, 来进一步尝试优化模型效果):
[训练结果]
总结
本文记录了试用腾讯云GPU服务器训练一个ViT图像分类模型的过程