作者 | Limarc Ambalina
来源 | lionbridge.ai
编辑 | 代码医生团队
随着特斯拉自动驾驶汽车的兴起以及谷歌Waymo等项目的兴起,自动驾驶汽车行业似乎每年都在增长。无人驾驶汽车是计算机视觉的一个重要领域,具有众多应用程序,并且具有巨大的获利潜力。
与所有计算机视觉算法一样,自动驾驶汽车需要训练有素的图像数据。通常很难获得大量的高质量图像或找到信誉良好的图像注释服务。手动注释成千上万张图像更加困难,有时效率低下。
在哪里可以找到免费图像和视频数据集以进行自动驾驶汽车开发?
以下是10个开放图像和视频数据集的列表,这些数据集非常适合在自动驾驶汽车研究和开发中使用。下面的数据集包含超过250,000张图像和静止视频帧,其中一些已经被注释。
1. BIT车辆数据集 –来自北京智能信息技术实验室的数据集包含9,850幅车辆图像。这些图像按车辆类型分为以下六类:公共汽车,小型客车,小型货车,轿车,SUV和卡车。
http://iitlab.bit.edu.cn/mcislab/vehicledb/
2. 城市景观图像对-使用从德国驾驶的车辆拍摄的交通视频,该数据集包括2,975个图像对。每个单独的图像文件的左侧都有原始的静止帧,而右侧在语义上已分割了相同的帧。
https://www.kaggle.com/dansbecker/cityscapes-image-pairs
来自“城市景观图像对”数据集的样本图像
3. GTI车辆图像数据库 –此数据集包括3,425个道路上车辆的后角图像,以及3,900个没有车辆的道路图像。
https://www.gti.ssr.upm.es/data/Vehicle_database.html
4. 带边界框的KITTI对象检测 –取自卡尔斯鲁厄技术学院的基准套件,该数据集由该套件的对象检测部分中的图像组成。该图像数据集包括超过14,000张图像,这些图像由7,518张测试图像和7,481张训练图像组成,并在单独的文件中带有边界框标签。
https://www.kaggle.com/twaldo/kitti-object-detection
来自KITTI对象检测数据集的样本图像
5. LISA红绿灯数据集 –尽管此数据集不专注于车辆,但它仍然是用于训练自动车辆算法的非常有用的图像数据集。LISA交通信号灯数据集包括夜间和白天的视频,总计43,0007帧,其中包括带注释的113,888个交通信号灯。该数据集的重点是交通信号灯。但是,几乎所有车架中都装有交通信号灯和车辆。
https://www.kaggle.com/mbornoe/lisa-traffic-light-dataset
6. 尼泊尔车辆-由加德满都街头拍摄的总共30部交通视频组成,该数据集包含从这些视频中裁剪的4,800辆车辆的图像。在4800张图像中,有1811张为两轮车,而2989张为四轮车。
https://github.com/sdevkota007/vehicles-nepal-dataset
7. 雨雪交通监控 –该数据集由22个视频组成,每个视频约5分钟。使用RGB彩色相机和红外热像仪捕获视频。因此,数据包括超过130,000个RGB热图像对。
https://www.kaggle.com/aalborguniversity/aau-rainsnow
8. 斯坦福汽车数据集 –来自斯坦福大学AI实验室的数据集包含196种不同类型汽车的16,185张图像。
http://ai.stanford.edu/~jkrause/cars/car_dataset.html
9. 自动驾驶汽车的语义分割 –作为Lyft Udacity Challenge的一部分创建,此数据集包含5,000张图像和相应的语义分割标签。
https://www.kaggle.com/kumaresanmanickavelu/lyft-udacity-challenge#dataB.tar.gz
10. TME高速公路数据集 –由28个视频片段组成,总计27分钟的视频,该数据集包括30,000多个带有车辆注释的帧。
http://cmp.felk.cvut.cz/data/motorway/