首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

利用DeepLab在Tensorflow中进行语义图像分割

语义图像分割,也就是将“道路”、“天空”、“人”和“狗”等语义标签分配给图像中每一个像素的任务,可以实现大量的新应用,例如 Pixel 2 与 Pixel 2 XL 智能手机人像模式中附带的合成浅景深效果,以及移动实时视频分割。分配这些语义标签需要标出对象的轮廓,因此,它对定位精度的要求比其他视觉实体识别任务(例如图像级分类或边界框级检测)更加严格。

我们高兴地宣布将 Google 最新、性能最好的语义图像分割模型 DeepLab-v3+ (在 Tensorflow 中实现)开源:

https://github.com/tensorflow/models/tree/master/research/deeplab

此次发布包括基于一个强大的卷积神经网络 (CNN) 骨干架构构建的 DeepLab-v3+ 模型,这些模型可以获得最准确的结果,预期用于服务器端部署。作为此次发布的一部分,我们还将分享 Tensorflow 模型训练与评估代码,以及已在 Pascal VOC 2012 和 Cityscapes 基准语义分割任务中预先训练的模型。

自从我们 DeepLab 模型的第一个版本在三年前发布以来,优化的 CNN 特征提取器、更好的对象比例建模、对情景信息的仔细同化、改进的训练过程,以及越来越强大的硬件和软件令 DeepLab-v2 和 DeepLab-v3 取得了提升。在 DeepLab-v3+ 中,我们在 DeepLab-v3 的基础上添加了一个简单有效的解码器模型以优化分割结果,尤其是对象边界处的结果。我们进一步将深度可分离卷积应用到孔空间金字塔池化和解码器模块,从而形成更快、更强大的语义分割编码器-解码器网络。

得益于方法、硬件和数据集的发展,基于卷积神经网络 (CNN) 构建的现代语义图像分割系统的准确性已经达到五年前难以想象的水平。我们希望与社区公开分享自己的系统可以让学术界和产业界的其他团队更轻松地重现并进一步改进最先进系统,使用新数据集训练模型,以及为此技术构想新的应用。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180322G1HN8C00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券