腾讯AI Lab正式开源业内最大规模多标签图像数据集(附Github开源地址)


来源:腾讯开源(ID:tencentopen)

编辑:木青

【新智元导读】腾讯AI Lab正式开源业内最大规模多标签图像数据集。10月17日,腾讯AI Lab在深圳宣布开源“Tencent ML-Images”项目,旨为视觉任务提供强大支撑,促进人工智能行业共同发展。

震撼!AI WORLD 2018世界人工智能峰会开场视频

10月17日,腾讯AI Lab在深圳宣布正式开源“Tencent ML-Images”项目,该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。

以下为腾讯官方公布的该开源项目的主要内容:

  1. ML-Images数据集的全部图像URLs,以及相应的类别标注。出于原始图像版权的考虑,此次开源将不直接提供原始图像,用户可利用我们提供的下载代码和URLs自行下载图像。
  2. ML-Images数据集的详细介绍,包括图像来源,图像数量,类别数量,类别的语义标签体系,标注方法,以及图像的标注数量等统计量。
  3. 完整的代码和模型。我们提供的代码涵盖从图像下载,图像预处理,基于ML-Images的预训练,基于ImageNet的迁移学习,到基于训练所得模型的图像特征提取的完整流程。该项目提供了基于小数据集的训练示例,以方便用户快速体验我们的训练流程。该项目还提供了非常高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。

该项目的开源,是腾讯AI Lab在计算机视觉领域所累积的基础能力的一次释放,为人工智能领域的科研人员和工程师提供了充足的高质量训练数据,及简单易用、性能强大的深度学习模型,为包括图像、视频等在内的视觉任务提供强大支撑,并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升,促进人工智能行业共同发展。

Github开源地址:

https://github.com/Tencent/tencent-ml-images

请给 Tencent ML-Images 一个 Star !

欢迎提出你的 issue 和 PR

Tencent ML-Images 国内镜像地址:

https://git.code.tencent.com/Tencent_Open_Source/Tencent-ML-Images

腾讯工蜂源码系统为开源开发者提供完整、最新的腾讯开源项目国内镜像。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2018-10-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏罗鑫骥的专栏

个性化推荐系统从0到1

在互联网信息爆炸式增长的当今,通过传统人工筛选运营方式提供服务时代已然过去,本文作者结合目前手机QQ浏览器软件应用App分发业务发展需求,历时半年多时间,从无到...

4.6K10
来自专栏机器之心

终结谷歌每小时20美元的AutoML!开源的AutoKeras了解下

Google AI 终于发布了 AutoML 的 beta 版,有人说这项服务将彻底改变深度学习的方式。

13220
来自专栏AI派

机器学习法则:ML工程的最佳实践

Martin Zinkevich 在2016年将 google 内容多年关于机器学习相关的经验分享了出来,这篇文章是对该分享的一些翻译+解读,如果想查看原文请参...

18530
来自专栏PPV课数据科学社区

工具 | Facebook 开源产业级深度学习框架 Caffe2,带来跨平台机器学习工具

来源:caffe2.ai 作者:caffe2 team 译者:文强 【导读】近日,Facebook 宣布开源 production-ready 的深度学习框架 ...

34650

关于情绪分析项目的10个提议

在我的统计学硕士学位论文项目过程中,我专注于情感分析的问题。情感分析是自然语言处理的一个应用,目的是识别情感(积极的vs消极的vs中性的),主观性(客观的vs主...

29460
来自专栏机器之心

专访 | 小白也能搭建深度模型,百度EasyDL的背后你知多少

随着机器学习,尤其是深度学习在复杂数据上的表现越来越优秀,很多开发者希望能将其应用到自己的服务或产品中。然而即使是使用预训练模型或开源框架,对于很多不太了解机器...

13220
来自专栏技术翻译

8个深度学习框架

随着越来越多的企业希望扩大其运营规模,它们已成为接受机器学习和预测分析的必要条件。人工智能与正确的深度学习框架相结合,真正放大了企业在其领域内可以实现和获得的整...

32530
来自专栏IT派

回顾 | Facebook开源产业级深度学习框架 Caffe2

AI 模型的训练和部署通常与大量数据中心或超级计算机相关联,原因很简单。从大规模的图像、视频、文本和语音等各种信息中持续处理、创建和改进模型的能力不是小型计算擅...

41670
来自专栏PPV课数据科学社区

【译】从文本挖掘和机器学习中洞悉数据

版权申明 作者:Murat Yazici 原文链接:http://www.ibmbigdatahub.com/b ... rning 翻译:星星 ...

29090
来自专栏PPV课数据科学社区

【学习】数据可视化的秘密和数据绘图的要素

研究数据的方法有很多,比如利用统计方法,计算数据的平均值和标准差;再比如使用模型,拟合数据。数据通常是大量的,人脑难以直接把握其中的信息。研究数...

28170

扫码关注云+社区

领取腾讯云代金券