【开源公告】腾讯 AI Lab 正式开源业内最大规模多标签图像数据集

2018年10月17日,深圳 - 今日,腾讯AI Lab宣布正式开源“Tencent ML-Images”项目,该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。

该开源项目的主要内容包括:

  1. ML-Images数据集的全部图像URLs,以及相应的类别标注。出于原始图像版权的考虑,此次开源将不直接提供原始图像,用户可利用我们提供的下载代码和URLs自行下载图像。
  2. ML-Images数据集的详细介绍,包括图像来源,图像数量,类别数量,类别的语义标签体系,标注方法,以及图像的标注数量等统计量。
  3. 完整的代码和模型。我们提供的代码涵盖从图像下载,图像预处理,基于ML-Images的预训练,基于ImageNet的迁移学习,到基于训练所得模型的图像特征提取的完整流程。该项目提供了基于小数据集的训练示例,以方便用户快速体验我们的训练流程。该项目还提供了非常高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

该项目的开源,是腾讯AI Lab在计算机视觉领域所累积的基础能力的一次释放,为人工智能领域的科研人员和工程师提供了充足的高质量训练数据,及简单易用、性能强大的深度学习模型,为包括图像、视频等在内的视觉任务提供强大支撑,并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升,促进人工智能行业共同发展。

Github开源地址: https://github.com/Tencent/tencent-ml-images (点击文末阅读原文直接访问)

请给 Tencent ML-Images 一个 Star !  欢迎提出你的 issue 和 PR

 Tencent ML-Images 国内镜像地址:

https://git.code.tencent.com/Tencent_Open_Source/Tencent-ML-Images

腾讯工蜂源码系统为开源开发者提供完整、最新的腾讯开源项目国内镜像。

原文发布于微信公众号 - 腾讯开源(tencentopen)

原文发表时间:2018-10-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏深度学习之tensorflow实战篇

算法岗位做数据挖掘大多都是抽特征跑跑现成模型”

这句话,说起来很简单,看起来也很容易,但真的是这样吗? 我列举几点,扩展一下上面这句话: 1、label符合业务场景吗?label准确吗?能够校准吗?放在哪张表...

34990
来自专栏机器之心

学界 | 香港浸会大学:四大分布式深度学习框架在GPU上的性能评测

选自arXiv 作者:施少怀、褚晓文 机器之心编译 参与:陈韵竹、李泽南 随着深度学习应用不断进入商用化,各类框架在服务器端上的部署正在增多,可扩展性正逐渐成为...

36770
来自专栏人人都是极客

AI和IOT的结合:现在和未来

为了更好地为目标客户服务,嵌入式设计团队今天正在研究新技术,如机器学习(ML)和深度学习(DL)。ML和DL使这些设计人员可以更快,更有限的资源开发和部署复杂的...

14520
来自专栏机器学习算法工程师

详解基于内容的推荐算法

本文介绍的将会是推荐系统最古老的算法:基于内容的推荐算法(Content-Based Recommendations CB)。

47230
来自专栏周鸿宇的专栏

【SPA大赛】如何预测移动 App 广告点击率

计算广告是互联网最重要的商业模式之一,广告投放效果通常通过曝光、点击和转化各环节来衡量,大多数广告系统受广告效果数据回流的限制只能通过曝光或点击作为投放效果的衡...

76400
来自专栏机器之心

业界 | 谷歌大脑开源多种新型神经网络优化器,AutoML探索新架构

选自Google Research Blog 作者: Irwan Bello 机器之心编译 参与:张倩、刘晓坤 谷歌大脑团队希望用类似于 AutoML 发现新神...

33440
来自专栏新智元

AutoML又一利器来了,谷歌宣布开源AdaNet(附教程)

今天,谷歌宣布开源AdaNet,这是一个轻量级的基于TensorFlow的框架,可以在最少的专家干预下自动学习高质量的模型。

31650
来自专栏机器之心

超参数搜索不够高效?这几大策略了解一下

当然,并非所有变量对模型的学习过程都一样重要,但是,鉴于这种额外的复杂性,在这样一个高维空间中找到这些变量的最佳配置显然是一个不小的挑战。

21920
来自专栏机器学习算法与Python学习

超参数优化,这些策略了解一下!

当然,并非所有变量对模型的学习过程都一样重要,但是,鉴于这种额外的复杂性,在这样一个高维空间中找到这些变量的最佳配置显然是一个不小的挑战。

77230
来自专栏AI研习社

只需连接电脑摄像头,就能用深度学习进行实时对象检测

实时对象检测是一个非常有趣的话题。 我们应如何可靠地检测视频输入中的人和其他现实生活中的物体? 最近我设法构建了一个非常简单的应用程序,只需连接到用户的电脑网络...

19720

扫码关注云+社区

领取腾讯云代金券