业内最大规模多标签图像数据集开源 | GitHub资源

允中 发自 凹非寺 量子位 报道

开源地址来了。

上个月,腾讯AI实验室宣布开源多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101.

现在,GitHub地址传送如下:

https://github.com/Tencent/tencent-ml-images

开源内容包含3方面:

  • ML-Images数据集的全部图像URLs,以及相应的类别标注。出于原始图像版权的考虑,此次开源将不直接提供原始图像,用户可利用我们提供的下载代码和URLs自行下载图像。
  • ML-Images数据集的详细介绍,包括图像来源,图像数量,类别数量,类别的语义标签体系,标注方法,以及图像的标注数量等统计量。
  • 完整的代码和模型。我们提供的代码涵盖从图像下载,图像预处理,基于ML-Images的预训练,基于ImageNet的迁移学习,到基于训练所得模型的图像特征提取的完整流程。 该项目提供了基于小数据集的训练示例,以方便用户快速体验我们的训练流程。 该项目还提供了非常高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

最后,关于腾讯本次开源详情解读,可移步前情报道:腾讯开源业内最大多标签图像数据集,附ResNet-101模型

另外值得一提的是,这已是腾讯开源的第58个项目(https://github.com/Tencent),特别是在加大投入AI等基础技术研究后,鹅厂的回馈和福利也在增多。

作者系网易新闻·网易号“各有态度”签约作者

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-10-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

Ouster将相机与激光雷达融合,并更新了开源驱动程序

当Ouster三年前开始开发OS-1时,相机的深度学习研究超过了激光雷达研究。激光雷达数据具有令人难以置信的好处,丰富的空间信息和照明无法识别也能感应,但它缺乏...

6371
来自专栏大数据

协同过滤的R语言实现及改进

协同过滤算法(CF)是构建推荐系统时最常用的技术之一。它可以基于收集到的其他用户的偏好信息(协同)来自动地预测当前用户的兴趣点。协同过滤算法主要分为两种:基于记...

3976
来自专栏AI科技大本营的专栏

唇语识别技术的开源教程,听不见声音我也能知道你说什么!

【导读】唇语识别系统使用机器视觉技术,从图像中连续识别出人脸,判断其中正在说话的人,提取此人连续的口型变化特征,随即将连续变化的特征输入到唇语识别模型中,识别出...

1951
来自专栏北京马哥教育

只需十四步:从零开始掌握 Python 机器学习(附资源)

分享一篇来自机器之心的文章。关于机器学习的起步,讲的还是很清楚的。原文链接在:只需十四步:从零开始掌握Python机器学习(附资源) Python 可以说是现...

4028
来自专栏机器之心

学界 | 价值传播网络,在更复杂的动态环境中进行规划的方法

规划是许多领域人工智能体的关键组成部分。然而,经典规划算法的局限性在于,对于每种可能的规划实例,人们都需要知道如何为其搜索最优(或至少合理的)方案。环境动态和状...

761
来自专栏ATYUN订阅号

DeepSense:用于时间序列移动传感数据处理的深度学习框架

DeepSense是在移动设备上运行的深度学习框架,它可以完成移动传感器(如运动传感器)数据集上的回归和分类任务。分类任务的第一个例子是异构人类活动识别(HHA...

4115
来自专栏PaddlePaddle

【AI核心技术】课程十: AlexNet 深度学习关键突破

UAI与PaddlePaddle联合推出的【AI核心技术掌握】系列课程持续更新中!

1105
来自专栏AI科技大本营的专栏

AI 技术讲座精选:ChainerMN 分布式深度学习的性能

2017深度学习峰会于今年1月在旧金山落下帷幕。会上,PFN 发布了其在多节点环境下使用 Chainer 的分布式深度学习所取得的进展。在今天的这篇文章中,我会...

38812
来自专栏量子位

谷歌发布轻量级视觉架构MobileNetV2,速度快准确率高

虽然深度学习在图像分类、检测等任务上颇具优势,但提升模型精度对能耗和存储空间的要求很高,移动设备通常难以达到要求。

851
来自专栏CDA数据分析师

机器学习的5种“兵法"

在研究机器学习中,理论在其整个自上而下方法中试用于哪里呢? 在传统的机器学习教学中,丰富的数学理论知识对于理解机器学习是至关重要的,我的机器学习教学方法通常是教...

1897

扫码关注云+社区

领取腾讯云代金券