数据来源:主要通过对初始数据图片进行人工标注和机器标注。数据样本非常的重要,好的样本等于成功了一半。
从 Caffe model zoo 找到适用模型之后主要针对两个文件进行修改调整:第一个文件是输入,比如说修改一下 data 文件,或将输入的地址改成刚刚定义的 TXT 文件;第二个是 solver 文件,对 baselr 参数进行调整。
△ 图8 模型输入修改
调整完输入和 solver 文件就可以进行深度学习训练了。根据任务的大小,训练往往会花费几个小时、甚至几周。训练完之后 Caffe 会生成 model 文件,可以直接用 Caffe text 将模型的参数代入,对测试文件进行预测,并输出预测的结果。
计算
训练计算方式主要有命令行和 python 接口两种方式。上文提到的训练方式主要是以命令行的方式进行的。此外我们还可以通过 python 接口进行训练。
通过 python 接口进行预测的 Caffe 主体代码,在开始时定义 Caffe 的 net,这里需要指定模型,指定的参数文件。图9 中间一段代码是对输入的图片进行诸如将像素减去平均值这类的预处理。完成之后输入需要进行预测的图片,将图片的地址给它,调用前向传播,就可以得到一个输出,这里是不需要做反向传播,因为我们是进行预测而不是训练,最后可以把预测结果打印出来。
图9 python 接口