专栏首页相约机器人适用于机器学习的18种最佳机器人数据集

适用于机器学习的18种最佳机器人数据集

来源| lionbridge.ai

编辑| 代码医生团队

由于机器人技术的不断发展,机器人数据集变得越来越普遍。在医疗保健领域,旨在协助繁忙医院工作人员的机器人已经在测试中。在工业领域,各种各样的机器人用于焊接,清洁,切割和构造各种不同的工具和物体。在商业领域,无论是在道路上还是在空中,我们都看到了自动驾驶汽车的飞速发展。

许多机器人技术中的机器学习数据集都是开源的,可供有兴趣研究和开发自己的机器人解决方案的任何人使用。但是,正确的数据集并不总是很容易找到,因此在互联网上搜寻它们会花费一些时间。为了提供帮助,我们汇总了18个机器人数据集的列表。它涵盖了机器人运动,计算机视觉,机器人车辆等。

我们希望该清单为您提供一个扎实的起点,以帮助您进一步了解该领域,或在机器人项目中开始自己的机器学习!

机器人数据集

通用机器人数据集

密歇根大学机器人技术数据集:通过UMR数据集页面,可以访问各种数据集。他们的收藏包括两足动物机器人,视频,安全态势感知以及腿部关节运动学,动力学和EMG活动的数据集。数据集由NeuRRo Lab,Roahm Lab,Corso Research Group和April Robotics Laboratory提供。

https://robotics.umich.edu/research/datasets/

麻省理工学院机器人数据集存储库:称为Radish,该数据集存储库涵盖了从真实机器人获取的里程计,激光,声纳和传感器数据。您还将找到由机器人和人工生成的环境图。

https://dspace.mit.edu/handle/1721.1/62236

令人敬畏的机器人数据集:由Github用户Sunlok Choi提供,这个庞大的存储库涵盖了广泛的数据集,分为以下几类:数据集集合,特定地点的数据集,特定主题的数据集和特定主题的计算机视觉数据集。该存储库的庞大规模使其成为与机器人技术中的机器学习相关的项目的理想起点。

https://github.com/sunglok/awesome-robotics-datasets

RoboNet大规模多机器人学习数据集:该数据集由伯克利人工智能研究公司提供,包含来自机器人的1500万个视频帧,这些视频帧是在桌面环境中与不同对象进行交互的。数据集的既定目标是“……在足够多样化的数据集上预训练强化学习模型,然后将知识转移到不同的测试环境中。”

https://bair.berkeley.edu/blog/2019/11/26/robo-net/

机器人运动数据集

The RoboTurk Real Robot Datset:斯坦福视觉与学习中心的该数据集目前是通过远程遥控操作进行机器人操纵的最大数据集。该数据是在一周内与54位操作员一起收集的,其中包括针对3个具有挑战性的操作任务的111个小时的机器人操作数据。特别是,这些数据对于需要灵巧控制和人为计划的任务很有帮助。

http://roboturk.stanford.edu/realrobotdataset.html

Google Brain机器人数据:该机器人运动存储库着重于机器人手臂的动作。可用的数据集包括抓取,推送,倾倒和深度图像编码。为了支持这些数据集,您还将找到一组程序生成的随机对象,可以在这些对象上训练机器人的抓握力和其他任务。

https://sites.google.com/site/brainrobotdata/home

日常交互操作数据集:此机器人运动数据集旨在教机器人在变化的环境中进行日常交互操作。数据集集中在日常任务中操纵的对象的位置,方向,力和扭矩。

https://journals.sagepub.com/doi/full/10.1177/0278364919849091

计算机视觉数据集

Robot @ Home数据集:来自《国际机器人研究杂志》的计算机视觉数据集用于家庭环境的语义映射。该数据集是来自家庭环境的原始和经过处理的感官数据的集合。它包含87,000多个带时间戳的观测值。

https://journals.sagepub.com/doi/full/10.1177/0278364917695640

用于场所分类的福冈数据集:此处的数据集收集日本福冈各地的室内和室外场景。它包括森林,市区,室内停车场,室外停车场,沿海和居民区,走廊,办公室,实验室和厨房。

http://robotics.ait.kyushu-u.ac.jp/kyushu_datasets/

DTU机械手图像数据集:这两个随机对象的数据集是通过独特的实验设置生成的。一个数据集用于评估点要素,一个数据集用于评估多视图立体。由于该设置旨在避免光污染,因此该过程允许使用大量高质量数据。

http://roboimagedata.compute.dtu.dk/

机器人技术和计算机视觉数据集的存储库: MRPT数据集集合是来自移动机器人,车辆和手持式传感器的数据集的所在地。该集合包含用于城市场景和里程表的一系列数据集,以及来自其他实验室的开源研究。

https://www.mrpt.org/robotics_datasets

新的大学视觉和激光数据集:该数据集是在穿过一所大学及其毗邻的公园时收集的。它适用于移动机器人和视觉研究社区,以及对6自由度导航和制图感兴趣的人们。

https://ori.ox.ac.uk/older-projects/new-college-dataset/

机器人车辆数据集

FMP数据集:由福特自动驾驶中心创建,该数据集包含单眼RGB图像的FCAV M-空中行人(FMP)数据集以及用于行人检测的Planar LiDAR数据。数据集是在密歇根大学校园的室外环境中收集的。

https://github.com/umautobots/FMP-dataset

牛津机器人学院的RobotCar数据集:此数据集包含100 多次重复的贯穿英国牛津的一致路线。它包括各种各样的天气类型,一天中的时间以及道路工程和施工。该数据集的目的是研究现实世界中动态城市环境中自动驾驶汽车的长期定位和制图

https://robotcar-dataset.robots.ox.ac.uk/

Kitti Vision Benchmark Suite:这套数据集是在卡尔斯鲁厄市周围行驶时捕获的。它包括农村地区和高速公路,每个图像最多可见15辆汽车和30位行人。

http://www.cvlibs.net/datasets/kitti/

复杂的城市数据集:此数据集提供来自城市环境的LiDAR数据,包括复杂的建筑物,居民区和都会区。其目的是解决复杂市区的主要问题,例如不可靠且零星的GPS数据,多车道道路,复杂的建筑结构以及大量高动态物体。

http://irap.kaist.ac.kr/dataset/

MultiDrone公共数据集:该数据集是由既有材料和新拍摄的材料组成的。许多注释都用于视觉检测任务,例如跟踪自行车,足球运动员和人群。其他视觉数据包括赛艇,环境和建筑物。

https://multidrone.eu/multidrone-public-dataset/

自主空间机器人实验室数据集: ASRL是研究移动机器人的空间和地面应用的机器人实验室。他们目前的重点是基于视觉的导航,允许移动机器人在室外非结构化环境中行驶。这里的数据集包括用于月球巡回飞行器的导航数据集,以及用于模拟行星地形的3D映射数据集。

http://asrl.utias.utoronto.ca/datasets/index.html

本文分享自微信公众号 - 相约机器人(xiangyuejiqiren),作者:代码医生

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-04-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 网络上最大的机器学习数据集列表

    包含CV、NLP、Self-driving、QA、Audio、Medical等,随机列出10个数据集供预览。

    代码医生工作室
  • Lyft开源L5自动驾驶数据集:55000个人工标注的3D注释框架,还有高清空间语义地图

    这份L5数据集内容丰富,加入了原始传感摄像头和激光雷达收集到的内容,内含55000个人类标注的3D注释框架,还有高清空间语义地图。

    代码医生工作室
  • 拥有免费数据集的十大优秀网站

    如果是一位尚未尝试过数据科学项目的初学者,那么从“没有经验”的起点到称为“专家”的非常理想的目的地的可能过渡只不过是数据集。

    代码医生工作室
  • 数据分析师职业发展白皮书(2015版)第一——三部分

    数据分析师职业发展白皮书(2015版) 目 录 一、是技术也是艺术——CDA研究院和业界前沿公司和对数据分析的认识 二、数据分析师职业发展历程 ...

    小莹莹
  • 数据流动在于利益关系

    今天聊聊阿里前数据团队负责人车品觉的《数据的本质》,书名的后缀虽然有“本质”两个字,但从我的理解看,书中并没有直接讲“本质”,更多的是基于作者在阿里的从业经验从...

    彭华盛
  • 一文了解数据湖引擎

    数据湖引擎是一种开源软件解决方案或云服务,它通过一组统一的api和数据模型为分析工作负载的各种数据源提供关键功能。数据湖引擎解决了快捷访问、加速分析处理、保护和...

    WindyQin
  • 用这10篇优质干货,带你开启新年数据之旅

    不知不觉鸡年已经进入尾声,在这一年,DT君用37场线上数据侠实验室,聚集了来自各个行业的数据玩家,带大家重新用数据解读城市与商业。今天,我们精选出10篇优质的内...

    DT数据侠
  • 开发 | 数据预处理和挖掘究竟该怎么做?硅谷网红告诉你

    Siraj Raval 作为深度学习领域的自媒体人在欧美可以说是无人不知、无人不晓。 凭借在 Youtube 上的指导视频,Siraj Raval 在全世界吸...

    AI科技评论
  • DT时代下[个推3.0]遵循的四个法则

    DT(Data Technology),是以服务大众、激发生产力为主的技术。从IT时代走向DT时代,我们要思考如何用互联网技术、理念、思想去与传统行业进行交融和...

    个推君
  • 五个简单方法助力降低云数据中心安全风险

    家得宝、JP摩根大通、索尼影业和美国第二大医疗保险公司Anthem等知名企业相继传出重大的数据泄密事件后,各行各业的公司企业大力投资于数据保护技术。知名调研机构...

    静一

扫码关注云+社区

领取腾讯云代金券