前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >64000张汽车图片,再也没有理由说做汽车项目没有数据了

64000张汽车图片,再也没有理由说做汽车项目没有数据了

作者头像
大数据文摘
发布2020-02-12 09:49:39
3180
发布2020-02-12 09:49:39
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘出品

作者:曹培信

找不到合适的数据集来解决对应的机器学习问题,这种痛苦大概只有MLer们才知道。

关于汽车的项目很多,比如拍照识车、汽车比价等等,尽管这些项目本身难度不大,但是往往受制于数据集的质量,模型的效果不能很好的发挥。

Github上一位名叫Nicolas Gervais的小哥就给出了一个关于汽车的数据集,数据相当全质量也相当高,在汽车方面有机器学习项目要做的同学,赶紧码住!

数据集的来源是The Car Connection网站,该网站是全球最大的汽车评测网站之一,致力于让汽车研究更加容易,Nicolas就是从这个网站上爬取的汽车数据。

数据集包括它收集了297000张图片,但是其中许多是汽车的内部图像,关于汽车的外观应该有大约60000张照片。

所有的文件都对汽车的15个参数进行了标注:

代码语言:javascript
复制
'Make', 'Model', 'Year', 'MSRP', 'Front Wheel Size (in)', 'SAE Net Horsepower @ RPM',
'Displacement', 'Engine Type', 'Width, Max w/o mirrors (in)', 'Height, Overall (in)',
'Length, Overall (in)', 'Gas Mileage', 'Drivetrain', 'Passenger Capacity', 'Passenger Doors',
'Body Style'

并且根据这些参数来对图像进行命名,比如说名为Audi_A5_2013_43_18_210_20_4_73_54_182_24_FWD_4_2_Convertible_eUH.jpg的图片,代表的就是这样一辆车:

数据集下载链接:

https://drive.google.com/open?id=1TQQuT60bddyeGBVfwNOk6nxYavxQdZJD

可以说小哥爬的数据是相当用心了,其实在网上还有很多好的机器学习数据集,需要大家去慢慢探索,文摘菌也给大家再推荐一些可以找到好的数据集的网站。

Kaggle数据集:

www.kaggle.com/datasets

亚马逊数据集:

registry.opendata.aws

UCI机器学习库:

archive.ics.uci.edu/ml/datasets.html

谷歌的数据集搜索引擎:

toolbox.google.com/datasetsearch

微软数据集:

msropendata.com

Awesome公共数据集:

github.com/awesomedata/awesome-public-datasets

计算机视觉数据集:

www.visualdata.io

2020年机器都在日夜学习了,数据集也给你准备好了,赶紧开始你的机器学习之旅吧!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-01-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档