首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

多标签图像识别发展历程(2015~2020)

自从深度学习兴起之后,以ImageNet数据集为代表的通用识别在精度上实现了跳跃式的显著提升,在通用识别性能逐渐“饱和”之后,研究者们将目光投向了难度更高的 细粒度图像识别 与 多标签图像识别 。其中细粒度识别主要针对类间相似度高、粒度细的问题,而多标签识别主要针对图像内多个共存标签有依赖性、输出标签范围广的问题,简单来说就是,细粒度识别是更精细的通用识别,而多标签识别是更广泛的通用识别。 从输出标签的数量来看,通用识别和细粒度识别都是单标签识别,然而在大多数场景下,图像中都不会只有一个孤零零的类别,只是我们在标注数据集时会故意忽略非图像主体的其他类别从而作为单标签识别问题来建模,但是随着对内容理解要求的不断提高,我们越来越需要尽可能精确的识别出图像视频中的所有类别,这时就需要用多标签识别出场了。 与通用识别和细粒度识别相比,多标签识别任务本身更关注当图像中存在多个物体、多个类别标签时,如何建模不同物体、不同标签的相关性与依赖关系,这个问题在论文中也经常被称为共现依赖(label co-occurrences),当然也有一些方法关注多标签识别任务的其他性质。

03

快讯 | 旷视科技Face++宣布完成C轮4.6亿美元融资,刷新AI领域融资纪录

大数据文摘作品 10月31日,旷视科技Face++宣布正式完成C轮4.6亿美金融资,本轮由中国国有资本风险投资基金(简称“国风投”)领投,蚂蚁金服、富士康集团战略投资。 值得一提的是,本轮4.6 亿美元的融资金额刷新了国内人工智能领域融资纪录。旷视科技表示,完成本轮融资后,将进一步加大在金融安全、城市安防领域的投入,并将加快在城市综合大脑及手机智能领域的技术落地。旷视科技CEO印奇表示,在赋能机器之眼的技术愿景下,构建城市大脑是旷视人未来的重要社会使命。 本轮融资由 C1、C2两轮构成,同时引入包括中俄投资

03

学界 | 超越何恺明等组归一化 Group Normalization,港中文团队提出自适配归一化取得突破

AI 科技评论:港中文最新论文研究表明目前的深度神经网络即使在人工标注的标准数据库中训练(例如 ImageNet),性能也会出现剧烈波动。这种情况在使用少批量数据更新神经网络的参数时更为严重。研究发现这是由于 BN(Batch Normalization)导致的。BN 是 Google 在 2015 年提出的归一化方法。至今已有 5000+次引用,在学术界和工业界均被广泛使用。港中文团队提出的 SN(Switchable Normalization)解决了 BN 的不足。SN 在 ImageNet 大规模图像识别数据集和 Microsoft COCO 大规模物体检测数据集的准确率,还超过了最近由 Facebook 何恺明等人提出的组归一化 GN(Group Normalization)。原论文请参考 arXiv:1806.10779 和代码 https://github.com/switchablenorms

01

获奖无数的深度残差学习,清华学霸的又一次No.1 | CVPR2016 最佳论文

图像识别的深度残差学习————联合编译:李尊,陈圳、章敏 摘要 在现有基础下,想要进一步训练更深层次的神经网络是非常困难的。我们提出了一种减轻网络训练负担的残差学习框架,这种网络比以前使用过的网络本质上层次更深。我们明确地将这层作为输入层相关的学习残差函数,而不是学习未知的函数。同时,我们提供了全面实验数据,这些数据证明残差网络更容易优化,并且可以从深度增加中大大提高精度。我们在ImageNet数据集用152 层--比VGG网络深8倍的深度来评估残差网络,但它仍具有较低的复杂度。在ImageNet测试集中,

012
领券