ViT模型简介
ViT的全称是Vision Transformer, 该模型由Alexey Dosovitskiy等人提出1, 在多个任务上取得SoTA结果。...而类别标签位置对应的输出层结果通过一个网络后, 即得到ViT的输出。在预训练状态下, 该结果对应的ground truth可以使用掩码的某个patch作为替代。...[Ping值测试]
以下是笔者选择的服务器配置详细信息:
[服务器配置详细信息]
提交并结账后, 可以通过站内信查看密码并登录服务器:
[购买成功]
[站内信]
为了方便后续的连接, 可以在~/.ssh...(我们也可以通过增加模型的参数量, 如修改模型为vit\_small\_patch16\_224, 来进一步尝试优化模型效果):
[训练结果]
总结
本文记录了试用腾讯云GPU服务器训练一个ViT图像分类模型的过程...代理行为导致该服务器在一段时间内不可用, 幸运的是, 可以通过删除代理和提交工单的方式, 来恢复服务器的正常使用。