南开大学开源新图像分割算法,刷新精度记录 | 资源

铜灵 编译整理 量子位 出品

最近,南开大学提出一种边缘检测和图像分割算法,被称为首个在图像分割数据集BSDS500上F值(F-Feature)超越数据集本身人工标注平均值的实时算法。

作者之一程明明在微博介绍说,算法中每一步(stage)里的所有卷积层都是有用的,而非过去只要每步最后一个卷积层。

“这是很通用的技巧,基本上干什么任务都用得着,改几行代码就能实现。”程明明说。

目前算法已经开源,一起看一下。

方法介绍

简单来说,研究人员提出一种利用RCF(richer convolutional features)的精准边缘检测器,还能通过反向传播进行训练。

在广泛使用的图像分割数据集BSDS500上进行基准测试时,这个算法在ODS(固定轮廓阈值)情况下,F值达到0.811;在评估速度为30FPS(每秒帧率)情况下,RCF OSD F值达到0.806,达到了比较好的结果。

这是怎么做到的?

研究人员先基于VGG16框架,构建了一个简单的神经网络。可以看出,从conv3_1层到conv4_3层,生成的图像在不断变粗糙,且中间层中包含的很多细节并没有被其它层利用。

这可不行。在研究人员提出这种RCF架构,输入任意大小的图像,就能输出相同大小的边缘映射图。

研究人员将所有来自卷积层的层次特征组合成一个整体框架,其中所有参数均可自动学习多尺度和多水平的特征,检测边缘信息。

这个多尺度算法的pipeline如下:

先改变原始图像的大小构建一组图像金字塔(image pyramid),将这些图像输入到RCF网络进行前向传递。随后,用双线性插值法将边缘检测图恢复为原始大小,这些边缘图的平均值将输出成高质量边缘检测图。

在BSDS500数据集上评估时,这种方法超过了数据集原始的人类标注平均值。

当被问到这个算法是否超越人类时,程明明表示,算法目前只能获得比BSDS500基准测试的普通人类注释更好的F值,还不能说是“超越”人类。

“如果给人类标注员更多的时间和训练,人类会做得更好。”程明明说。

来自南开大学

目前,这项研究的论文Richer Convolutional Features for Edge Detection已被IEEE TPAMI(IEEE Transactions on Pattern Analysis and Machine Intelligence)期刊收录。

论文由Yun Liu(刘云)、Ming-Ming Cheng(程明明)、Xiaowei Hu(胡晓伟)、Jia-Wang Bia、 Le Zhang、Xiang Bai和Jinhui Tang 7人完成,其中前四位研究人员均来自南开大学媒体计算实验室。

媒体计算实验室主要研究针对可视媒体信息的智能计算方法,在实验室主页上我们看到,实验室“2019级入学的博士生和硕士生已经招满”。

一作刘云本科也毕业于南开大学,现为程明明的博士生,参与的论文经常在CVPR、ACCV和PRCV等顶会现身。

论文二作程明明本科毕业于西电 ,在牛津大学深造完成后回国,虽然只有34岁,已经是南开大学教授、国家“万人计划”青年拔尖人才,首批天津市杰出青年基金获得者了。

程明明

传送门

博客地址: https://mmcheng.net/zh/rcfedge/

论文全文: http://mftp.mmcheng.net/Papers/19PamiEdge.pdf

代码地址: https://github.com/yun-liu/rcf

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-10-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

MILA 2018夏季深度学习与强化学习课程资源大放送

MILA 2018 夏季课程包括深度学习夏季课程(DLSS)和强化学习夏季课程(RLSS),并主要由以下机构支持。Yoshua Bengio 等人组织的夏季课程...

14220
来自专栏AI科技评论

学界 | 机器学习十大算法都是何方神圣?看完你就懂了

AI科技评论按:机器学习与人工智能变得越来越热。大数据原本在工业界中就已经炙手可热,而基于大数据的机器学习则更加流行,因为其通过对数据的计算,可以实现数据预测、...

35950
来自专栏AI科技大本营的专栏

经典重译 | 来自华盛顿大学教授的机器学习“内功心法”

本文最初发表在 《ACM通讯》2012年第10辑。作者是华盛顿大学教授,著名的机器学习专家 Pedro Domingos。作者2016年凭借畅销书《终极算法》而...

34970
来自专栏AI科技评论

干货 | CNN 是如何处理图像中不同位置的对象的?

AI 科技评论按:这篇博客来自 Jetpac(现被谷歌收购) CTO、苹果毕业生、TensorFlow 团队成员 Pete Warden。文中讨论了当要识别的对...

17820
来自专栏机器之心

ICLR 2018 | 清华&斯坦福提出深度梯度压缩DGC,大幅降低分布式训练网络带宽需求

选自arXiv 作者:林宇鋆、韩松等 机器之心编译 参与:刘晓坤 来自清华大学和斯坦福大学的研究者们发现,分布式随机梯度下降训练中 99.9% 的梯度交换都是冗...

38880
来自专栏新智元

线性模型可解释一定比DNN高?UCSD科学家:大错特错!

【新智元导读】人们对深度学习模型的真正运行机制还远远没有完全了解,如何提高预测模型的“可解释性”成了一个日益重要的话题。近来的一篇论文讨论了机器学习模型的“可解...

7120
来自专栏AI研习社

CNN 是如何处理图像中不同位置的对象的?

AI 研习社按:这篇博客来自 Jetpac(现被谷歌收购) CTO、苹果毕业生、TensorFlow 团队成员 Pete Warden。文中讨论了当要识别的对象...

9710
来自专栏SIGAI学习与实践平台

怎样成为一名优秀的算法工程师

原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的。

25440
来自专栏AI研习社

博客 | 当 AI 开始学习艺术创作,我们应该觉得担心吗?

随着深度学习爆发式的成功,算法渐渐的被引入了一个人类认为相对安全的领域 —— 创造引人注目的艺术。

8710
来自专栏新智元

【11分钟训练完ImageNet】DNN训练再破纪录,1024 CPU Caffe开源

【新智元导读】此前,伯克利、TACC和UC戴维斯的研究人员使用新算法,在24分钟内训练完AlexNet,1小时训练完ResNet,创下了纪录。现在,他们继续推进...

602110

扫码关注云+社区

领取腾讯云代金券