备注:研究方向+地点+学校/公司+昵称,更快通过申请,长按加细分领域技术交流群,目前有细分领域:图像分割、图像目标检测、论文写作、车道检测、模型优化、目标跟踪、SLAM、点云处理(分割检测)、深度学习。
获取完整原文和代码,公众号回复:09100065689
论文地址: https://arxiv.org/abs/2011.01890
代码: 公众号回复:09100065689
来源: 科尔多瓦大学
论文名称:RealHePoNet: a robust single-stage ConvNet for head pose estimation in the wild
原文作者:Rafael Berral-Soler
内容提要
人脸姿态估计在人机交互、视频监控等领域有着广泛的应用。在本文中,将人脸姿态估计定义为对垂直(倾斜/俯仰)和水平(平移/偏转)角度的估计,通过使用单个卷积神经网络ConvNet模型,试图平衡精度和推理速度,以最大化其在现实应用中的可用性。我们的模型是在两个数据集的组合上训练的:Pointing 04 (旨在覆盖广泛的姿态)和Annotated Facial Landmarks in the Wild (为了提高我们的模型在真实世界图像上使用的鲁棒性)。定义了组合数据集的三个不同分区,目的是用于培训、验证和测试。通过这项工作,我们得到了一个经过训练的ConvNet模型,即RealHePoNet,它给出了一个低分辨率的灰度输入图像,并且不需要使用面部标志,能够以较低的误差估计倾斜角和平移角(测试分区的平均误差为4.4)。此外,由于推理时间较低(每个头大约6毫秒),我们认为我们的模型即使与中等规格的硬件(即GTX 1060 GPU)配对也可以使用。
主要框架及实验结果
声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请加上文微信联系删除。