在图像上进行训练需要大量的计算,以获得至少相当大的目标检测精度。由于我研究了像YOLO这样的目标检测模型的完全训练,据说在GPU上需要几个小时到几天的时间。然而,我们正在尝试为CNN训练实现一个硬件加速器,使用FPGA来实现像YOLO这样的对象检测模型,我们正在为我们大学的最后一年项目做这件事。由于我们正试图在进一步行动之前查明该项目的可行性,因此在这方面的任何建议都将是有帮助的。
发布于 2020-03-02 14:46:45
你永远不会真的想在FPGA或类似的“低成本”硬件上训练。训练需要更多的内存和更多的计算能力。
常见的方法是在GPU上正常训练网络,然后将其量化为在FPGA上运行所需的任何东西。完成后,您可以尝试将体系结构和权重加载到FPGA上。
我认为仅仅运行一个单一的网络体系结构就足够具有挑战性,所以从这个开始,然后考虑扩展它,以便运行任意的体系结构。
https://stackoverflow.com/questions/60474467
复制相似问题