近年来,因为拥挤人群计数在视频监控、公共安全方面的应用广泛,引起了不少学者的关注。
简单说来这个任务就是给定图像,返回该图像所描述场景中有多少人。
这可以帮助城市管理者、大型活动组织方实时了解人群拥挤情况,以利于早期防范群体事件、人群踩踏等。
和大多数计算机视觉任务面临相同的困境,视频数据容易获取,但标注却是个耗费大量人力物力的工作。
今天新上传到arXiv 的 CVPR 2019 的接收论文《Learning from Synthetic Data for Crowd Counting in the Wild》,来自西北工业大学的学者提出使用计算机图形工具创建拥挤人群数据集的方法,并开源了他们创建的大型数据集,在此数据集上训练的算法精度获得了大幅提升,超越了之前的state-of-the-art。
作者信息:
作者全部来自西北工业大学。
作者使用计算机图形学的方法,通过设置不同的多样化的场景、设置不同的人物模型,创建了大量的样本数据。
下图是与现有数据集的比较,可见该论文中提出的GCC数据集是目前最大的公开数据集。
同时,该数据集在每幅图像中行人个数、时间分布、天气情况分布各个方面也具有多样性,非常适合人群计数任务。
如何用这个数据集?
该数据集是合成数据集,作者提出两种方法,使用该数据集参与算法训练。
如下图,上面部分为监督学习方法,下面部分为使用域适应的方法。
一种是监督学习的方法,使用该大型数据集预训练网络,再在实际的真实场景数据集中微调网络。
使用这种方法,作者采用的网络模型:
获得了超越目前该任务state-of-the-art的精度。
使用域适应方法的算法流程图:
使用该数据集后,算法同样获得了大幅的精度提升。
作者已经公开了该数据集,并开源了数据创建标注工具。
https://github.com/gjy3035/GCC-CL
项目主页:
https://gjy3035.github.io/GCC-CL/
论文地址:
https://arxiv.org/pdf/1903.03303.pdf
感谢各位作者!