前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >快讯 | Facebook开源物体识别工具Detectron,加速计算机视觉研究

快讯 | Facebook开源物体识别工具Detectron,加速计算机视觉研究

作者头像
大数据文摘
发布2018-05-23 15:11:34
7800
发布2018-05-23 15:11:34
举报
文章被收录于专栏:大数据文摘

大数据文摘作品

作者:龙牧雪 冯晓丽

1月22日,Facebook的人工智能实验室(FAIR)开源了计算机视觉研究平台Detectron。Detectron系统实现了最先进的物体检测算法,包括Mask R-CNN。 它是用Python编写的,支持Caffe2深度学习框架。

就在2天前,纽约大学教授Yann LeCun刚刚宣布卸任Facebook人工智能实验室(FAIR)主任,并担任AI首席科学家。

?《业界丨Yann LeCun卸任Facebook AI实验室主任,称将回归科研》

在一些“搞事情”媒体各种“Facebook变天、LeCun连降两级”的报道之下,昨天,Yann LeCun又发了一个“澄清帖”,说明Jerome Pesenti所担任的AI副总裁是一个新职位,并不是来取代LeCun的AI实验室主任地位的,这一组织结构的变化在几个月前就已经发生。这一职位变动也从人员架构上说明了Facebook高层对AI的重视程度在提升。

正如Yann LeCun所言,Facebook人工智能实验室发展势头正猛。

近日,Facebook的人工智能实验室(FAIR)开源了计算机视觉研究平台Detectron。Detectron系统实现了最先进的物体检测算法,包括Mask R-CNN。 它是用Python编写的,支持Caffe2深度学习框架。

不久前,FAIR才开源了语音识别的工具wav2letter,戳这里看大数据文摘介绍《快讯 | Facebook开源语音识别工具包wav2letter》

这一系列工具的开源,将使更多研究人员能使用到Facebook的平台,进一步扩大Facebook人工智能实验室的影响力。

针对Detectron的开源,研究员Ross Girshick发表了一篇博客,具体介绍了该开源平台的性能。大数据文摘特摘录如下:

Mask R-CNN 输出的范例

Detectron 项目于2016年7月启动,旨在创建一个基于 Caffe2 的快速、灵活的物体检测系统。经过一年半的发展,Detectron 的代码库已趋于成熟,并支持了很多内部项目,比如:Mask R-CNN 和 Focal Loss for Dense Object Detection(ICCV 2017 - Marr奖项和最佳学生论文获奖项目)。

Detectron 支持的算法为计算机视觉关键任务(比如实例分割)提供了直观的模型,并在近年来社会上取得的视觉感知系统的巨大成果中发挥了关键作用。

除了研究,Facebook 许多团队使用 Detectron 平台来训练各种模型,模型可以部署在云端和移动设备上,应用在增强现实等领域。

我们希望通过开源Detectron平台,让我们的研究尽可能开放,并加速全球实验室的研究。随着其发布,研究人员能使用FAIR人员每天使用的同一软件平台,重现我们的研究结果。

Detectron介绍

Detectron的目标是为物体检测研究提供高质量、高性能的代码库。 它旨在灵活、快速地实施和评估新颖的研究内容。 Detectron包括以下物体检测算法的实现:

  • Mask R-CNN
  • RetinaNet
  • Faster R-CNN
  • RPN
  • Fast R-CNN
  • R-FCN

使用以下主干网络体系结构:

  • ResNeXt{50,101,152}
  • ResNet{50,101,152}
  • Feature Pyramid Networks (用 ResNet/ResNeXt)
  • VGG16

所有代码均已发布至GitHub,大家可以到这里下载:

https://github.com/facebookresearch/Detectron

素材来源:

https://research.fb.com/facebook-open-sources-detectron/

https://research.fb.com/downloads/detectron/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-01-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档