标签识别_识别<br>标签_图像标签识别 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

多标签图像识别发展历程（2015~2020）

自从深度学习兴起之后，以ImageNet数据集为代表的通用识别在精度上实现了跳跃式的显著提升，在通用识别性能逐渐“饱和”之后，研究者们将目光投向了难度更高的细粒度图像识别与多标签图像识别。其中细粒度识别主要针对类间相似度高、粒度细的问题，而多标签识别主要针对图像内多个共存标签有依赖性、输出标签范围广的问题，简单来说就是，细粒度识别是更精细的通用识别，而多标签识别是更广泛的通用识别。从输出标签的数量来看，通用识别和细粒度识别都是单标签识别，然而在大多数场景下，图像中都不会只有一个孤零零的类别，只是我们在标注数据集时会故意忽略非图像主体的其他类别从而作为单标签识别问题来建模，但是随着对内容理解要求的不断提高，我们越来越需要尽可能精确的识别出图像视频中的所有类别，这时就需要用多标签识别出场了。与通用识别和细粒度识别相比，多标签识别任务本身更关注当图像中存在多个物体、多个类别标签时，如何建模不同物体、不同标签的相关性与依赖关系，这个问题在论文中也经常被称为共现依赖（label co-occurrences），当然也有一些方法关注多标签识别任务的其他性质。

03

学界 | 发美照时打上「#」，还能帮Facebook提升图片识别率哟

AI 科技评论按：近日 Facebook 科学家团队发布基于主题标签的深度学习方法，使用已有的拥有主题标签的图片作为训练数据，从而大幅提升了训练数据集的大小。数据集的增大必然会引起图片错误率的提升，他们同时发布了处理图片噪音的方法。他们团队的这项工作对于现今的图片识别领域有着广泛而深远的影响。AI科技评论对全文翻译如下。

02

您找到你想要的搜索结果了吗？

是的

没有找到

多标签图像识别前沿跟踪2021（上）

本文主要介绍一些2021年新发表的多标签图像识别工作，多标签图像识别早些时候的研究工作可以看另一篇文章

03

硬件: RFID (射频识别)

射频识别（英语：Radio Frequency IDentification，缩写：RFID）是一种无线通信技术，可以通过无线电讯号识别特定目标并读写相关数据，而无需识别系统与特定目标之间建立机械或者光学接触。

02

Recognize Anything:一个强大的图像标记模型

Recognize Anything是一种新的图像标记基础模型，与传统模型不同，它不依赖于手动注释进行训练;相反，它利用大规模的图像-文本对。RAM的开发过程包括四个关键阶段:

02

电子标签的相关知识

RFID射频识别是一种非接触式的自动识别技术，它通过射频信号自动识别目标对象并获取相关数据，识别工作无须人工干预，可工作于各种恶劣环境。RFID技术可识别高速运动物体并可同时识别多个标签，操作快捷方便。

02

可微图学习&弱监督，中山大学提出新型行人重识别方法和史上最大最新评测基准

行人重识别，又称行人再识别，是利用 CV 技术判断图像或视频序列中是否存在特定行人的技术。常规的行人重识别方法往往需要高昂的人工标注成本，计算复杂度也很大。在本文中，中山大学研究者提出的弱监督行人重识别方法恰恰克服了这两方面的障碍，并发布了一个大型行人重识别数据集。

03

资源 | 适合小朋友的Scratch动手项目！AI在生活中的19个应用

大数据文摘作品编译：蒋宝尚、龙牧雪人工智能已经写入中小学课程标准，但在中小学阶段就已经入门人工智能的童鞋恐怕还是比较少见。戳蓝字可以看两篇小学生和中学生的编程指南：我12岁，4年码龄，我是这么学编程的一位16岁CEO教你如何在高中阶段入门人工智能如果你觉得Python对小朋友来说太难，那么图形化界面的Scratch编程语言可能是个不错的选择。我们找到了一个machine learning for kids的网站，上面搜集了各种和人工智能有关系的Scratch动手项目，一共19个，包括人脸识别、聊天

04

可微图学习&弱监督，中山大学提出新型行人重识别方法和史上最大最新评测基准

近期，中山大学发布了一种基于可微图学习的弱监督行人重识别（person re-ID）方法和一个大型数据集。该方法结合可微图学习和弱监督学习方法，为行人重识别深度神经网络加入自动生成训练标签的模块并与其一体训练。相比普通的行人重识别方法，该方法不需要高昂的人工标注成本，并且几乎不增加计算复杂度也能达到领先的模型性能。

02

借助Video Intelligence API实现视频智能检测识别

点击上方“LiveVideoStack”关注我们 ▲扫描图中二维码或点击阅读原文▲ 了解音视频技术大会更多信息编者按：MeshCloud通过与GCP合作为中国出海企业提供强大的全球基础架构。LiveVideoStack邀请到了MeshCloud的陈满老师，为我们介绍如何借助谷歌云在视频智能检测识别方面的技术与能力，实现海外音视频业务的快速与高质量部署。文/陈满整理/LiveVideoStack‍‍ 大家好，我是来自MeshCloud的陈满，今天我分享的主题是使用Google Cloud集成API实

01

半天实战经历快速让小白明白深度学习增强半监督人脸识别噪声

1、简介尽管深度人脸识别从大规模训练数据显著受益，但目前的瓶颈是标签成本。解决这个问题的一个可行的解决方案是半监督学习，利用一小部分的标记数据和大量的未标记数据。然而，主要的挑战是通过自动标签累积的标签错误，损害了培训。在本文中，我们提出了一个有效的对半监督人脸识别具有鲁棒性的解决方案。具体地说，我们引入了一种名为GroupNet(GN)的多代理方法，以赋予我们的解决方案识别错误标记的样本和保存干净样本的能力。我们表明，即使有噪声的标签占据了超过50%的训练数据，仅GN在传统的监督人脸识别中也达到了领先的精度。进一步，我们开发了一种半监督人脸识别解决方案，名为噪声鲁棒学习标签(NRoLL)，它是基于GN提供的鲁棒训练能力。它从少量的标签数据开始，因此对一个lar进行高可信度的标签索引术语-半监督的人脸识别，有噪声的标签学习。

04

ReID：无监督及领域自适应的目标重识别概述

无监督（unsupervised）及领域自适应（domain adaptive）的目标重识别是目标重识别领域中两个重要的研究方向，同时二者又关系密切。本文中部分配图和内容参考葛艺潇：无监督及领域自适应的目标重识别。

05

多模态人物识别技术及其在爱奇艺视频场景中的应用 | 公开课笔记

在本期 CSDN 技术公开课Plus：《多模态人物识别技术及其在视频场景中的应用》中，爱奇艺科学家路香菊博士将为大家介绍了多模态人物识别技术及在视频场景中的应用。大家可以学习到爱奇艺在多模态技术领域的三项主要研究工作，并且在爱奇艺视频中是如何应用这些技术的。

02

标注受限也能识别多标签图像！中山大学等发布异构语义转移HST框架 | IJCV 2024

随着深度学习的快速发展，许多研究者们开始尝试利用深度神经网络解决多标签图像识别（Multi-label Image Recognition, MLR）任务，并已取得了不俗的进展。

00

业界 | 对比了六家计算机视觉API，发现最好的竟然是...

选自free Code Camp 作者：Mariya Yao 机器之心编译参与：蒋思源、刘晓坤本文通过吉娃娃与松饼的图像对比了流行的六大计算机视觉API，作者希望能借助这些识别情况帮助读者了解各

06

AAAI 2023 Oral | 如何识别未知标签？多模态知识迁移框架实现新SOTA

机器之心专栏作者：腾讯优图实验室在多标签分类系统中，经常遇到大量在训练集中未曾出现的标签，如何准确地识别这些标签是非常重要也极富挑战性的问题。为此，腾讯优图实验室联合清华大学和深圳大学，提出了一种基于多模态知识迁移的框架 MKT，利用图文预训练模型强大的图文匹配能力，保留图像分类中关键的视觉一致性信息，实现多标签场景的 Open Vocabulary 分类。本工作已入选 AAAI 2023 Oral。论文链接：https://arxiv.org/abs/2207.01887 代码链接：https:/

01

企业如何守好“内容安全”关？腾讯安全天御给你锦囊妙计！

随着互联网的飞速发展，我们进入了一个信息爆炸的时代。图文、视频、聊天、直播等互动内容已经成为人们日常工作、生活不可或缺的部分。然而，在这些日益增长的内容中却充斥着各种不良言论、垃圾广告、涉黄等网络垃圾。这些流窜在互联网中的垃圾内容，不仅极大程度影响了用户体验，也让不少企业倍感困扰。面对日益复杂的安全形势，企业该如何“祛污”，守护内容安全？在首届腾讯 Techo 开发者大会云安全技术与应用专场上，腾讯安全业务安全总监杨红围绕《新时代的内容风控实践与创新》，针对文本、图片、音频等载体的内容安全，从现状分析、

02

吉娃娃还是松饼？找到最好的计算机视觉API

下面这张在网上流传的图片展示了吉娃娃和松饼之间惊人的相似之处。这些图像通常在人工智能(AI)行业(包括我自己)的演示中共享。但有一个问题没有人回答过：在消除像吉娃娃或松饼这样的图像的不确定性时，到

09

物联网关键技术之射频识别技术

在现在这个科技快速发展的时代，无人驾驶汽车、无人机等等高科技产品应运而生，这些高科技的产品在改变着我们的传统的生活方式。

01

ICCV 2019 | 半监督损失函数，利用无标签数据优化人脸识别模型

论文标题：Unknown Identity Rejection Loss: Utilizing Unlabeled Data for Face Recognition

02

Android | 通过机器学习实现精准字母手势识别

看过上一篇「一个很糙的字母手势识别方案」文章并尝试了的同学，就一定知道，「糙手势」的识别是有多糙，糙的只能识别字母「C」。今天这篇就用 Android 自带的 gesture API 来实现更为精准的识别。看到这里，有的同学可能就会说了，「标题党，哪有机器学习！」。别急，认真看，认真学。先上效果图，注意底部识别分数变化，至于为什么粉红色，这是「社会人」小猪佩奇的颜色好吧~ 编不下去了，这个画板源码部分借鉴了 github 下面链接的控件，TA用的就是粉色，我没改~ https://github.com/

05

图像标签背后的技术原理及应用场景

以上这些便利的功能，都使用了图像标签。它们背后的AI算法是如何读懂一张图片的呢？图像标签还有哪些应用？希望这篇文章可以回答你的疑问。

03

500张训练样本攻破验证码？蚂蚁金服提自监督表征学习识别方法

导语：国际顶级会议WWW 2020将于4月20日至24日举行。始于1994年的WWW会议，主要讨论有关Web的发展，其相关技术的标准化以及这些技术对社会和文化的影响，每年有大批的学者、研究人员、技术专家、政策制定者等参与。以下是蚂蚁金服的资深技术专家对入选论文《A Generic Solver Combining Unsupervised Learning and Representation Learning for Breaking Text-Based Captchas》做出的深度解读。

02

产品动态 | 腾讯云AI 10月产品更新

10月，文字识别OCR、语音识别、图片标签推出新功能。腾讯云AI团队联合腾讯优图、AILab、微信智聆、微信智言等实验室，帮助合作伙伴和客户高效打造针对性的解决方案，助力各行各业的数字化和智能化转型。

04

人脸识别从0到1之完美实现

1. 训练数据集的制作可以无限大，但是要考虑硬件的处理速度，我的笔记本就很慢;

02

Rainbond Java Maven 多模块源码构建

Maven 多模块项目是根据 pom.xml 文件(下面简称 pom)来划分的, Rainbond 对它的识别也是建立在 pom 的基础上的. 主要是识别出具体模块(module)的构建命令和启动命令. 构建命令的作用是指定需要构建的模块, 是类似于 "mvn install -pl 'module name' -am" 的 mvn 命令. 启动命令的作用是在构建完成后, 指定需要执行的 Jar 包, 是类似于 "web: java $JAVA_OPTS -jar *.jar" 的命令.

02

[AI安全论文] 14.S&P2019-Neural Cleanse 神经网络中的后门攻击识别与缓解

前一篇介绍英文论文审稿意见及应对策略的学习笔记，参考各位老师的学习和回答。这篇文章将翻译及分享S&P2019的一篇文章《Neural Cleanse: Identifying and Mitigating Backdoor Attacks in Neural Networks》，介绍神经网络中的后门攻击识别与缓解。

03

人脸识别技术介绍和表情识别最新研究

人脸识别作为一种生物特征识别技术，具有非侵扰性、非接触性、友好性和便捷性等优点。早在二十世纪初期，人脸识别已经出现，于二十世纪中期，发展成为独立的学科。人脸识别真正进入应用阶段是在90年代后期。人脸识别属于人脸匹配的领域，人脸匹配的方法主要包括特征表示和相似性度量。

02

人脸识别技术介绍和表情识别最新研究

人脸识别作为一种生物特征识别技术，具有非侵扰性、非接触性、友好性和便捷性等优点。早在二十世纪初期，人脸识别已经出现，于二十世纪中期，发展成为独立的学科。人脸识别真正进入应用阶段是在90年代后期。人脸识别属于人脸匹配的领域，人脸匹配的方法主要包括特征表示和相似性度量。

02

条码技术的相关知识

条码技术是实现POS系统、EDI、电子商务、供应链管理的技术基础，是物流管理现代化的重要技术手段。条码技术包括条码的编码技术、条码标识符号的设计、快速识别技术和计算机管理技术，它是实现计算机管理和电子数据交换不可少的前端采集技术。

03

动态 | 谷歌发布AVA数据库：5万个精细标注视频片段，助力识别人类动作

AI科技评论按：在计算机视觉研究中，识别视频中人的动作是一个基础研究问题。个人视频搜索和发现、运动分析和手势交流等应用中，都会用到这项至关重要的技术。尽管过去的几年里在图像中分类和识别物体的技术上，我们已经取得了令人振奋的突破，但识别人类的动作仍然是一个巨大的挑战。从本质上来说，视频中人的行为更难被明确定义，而物体的定义更为明确。所以构建精细动作标记的视频数据集非常困难。目前虽然有许多基准数据集，比如UCF101、ActivityNet和DeepMind Kinetics，采用基于图像分类的标签方案，为数据

谷歌发布 AVA 数据库：5 万个精细标注视频片段，助力识别人类动作

在计算机视觉研究中，识别视频中人的动作是一个基础研究问题。个人视频搜索和发现、运动分析和手势交流等应用中，都会用到这项至关重要的技术。尽管过去的几年里在图像中分类和识别物体的技术上，我们已经取得了令人振奋的突破，但识别人类的动作仍然是一个巨大的挑战。从本质上来说，视频中人的行为更难被明确定义，而物体的定义更为明确。所以构建精细动作标记的视频数据集非常困难。目前虽然有许多基准数据集，比如 UCF101、ActivityNet 和 DeepMind Kinetics，采用基于图像分类的标签方案，为数据集中的每

08

腾讯云云智AI资源包重磅推出

OCR文字识别，基于腾讯世界领先的深度学习技术和海量数据，提供卡证、票据类、印刷体、手写体、自定义模板等多种场景和类型的文字识别服务，大大提高信息录入效率、降低客户使用成本。

05

广告行业中那些趣事系列5：BERT实战多标签标注模型(附github源码)

摘要：之前广告行业中那些趣事系列2：BERT实战NLP文本分类任务(附github源码)，我们通过BERT构建了二分类器。这里根据实际项目需要使用BERT构建多标签标注模型，可通过一个模型识别多类标签，极大提升建模效率。实际项目中会根据业务需要同时使用二分类器和多标签标注模型完成文本识别任务。

03

深度学习应用篇-自然语言处理-命名实体识别[9]：BiLSTM+CRF实现命名实体识别、实体、关系、属性抽取实战项目合集（含智能标注）【上篇】

**命名实体识别（Named Entity Recoginition, NER）**旨在将一串文本中的实体识别出来，并标注出它所指代的类型，比如人名、地名等等。具体地，根据MUC会议规定，命名实体识别任务包括三个子任务：

03

NLP之NER：商品标题属性识别探索与实践

最近一段时间在做商品理解的工作，主要内容是从商品标题里识别出商品的一些属性标签，包括不限于品牌、颜色、领型、适用人群、尺码等等。这类任务可以抽象成命名实体识别（Named Entity Recognition, NER）工作，一般用序列标注（Sequence Tagging）的方式来做，是比较成熟的方向。

05

谷歌新发布了一个精确标注动作的数据集，堪称ImageNet视频版

作者： Chunhui Gu & David Ross 编译：魏子敏，龙牧雪，谭婧就在昨天，谷歌blog发布了一个堪比“视频版”ImageNet的数据集-AVA（A Finely Labeled Video Dataset for Human Action Understanding ），为视频动作识别这一图像识别中的重大课题提供了新的“原材料”。这个崭新的数据集填补了在复杂的场景下，多人执行不同操作的标注空白。以下为google blog原文，大数据文摘对其进行了编译：在计算机视觉领域，教会机器在视

04

通过子概念从弱标签视频中学习

视频识别是计算机视觉中的一项核心任务，其应用范围从视频内容分析到动作识别。然而，用于视频识别的训练模型通常需要手动注释未修剪的视频，这可能非常耗时。为了减少收集带有注释的视频的工作量，从带有弱标签的视频中学习视觉知识，即注释是在没有人工干预的情况下自动生成的，由于大量易于访问的视频数据而引起了越来越多的研究兴趣 . 例如，通常通过使用关键字查询视频识别模型旨在分类的类别来获取未修剪的视频。然后将一个关键字（我们称为弱标签）分配给获得的每个未修剪视频。

04

一文读懂RFID固定资产管理软件

通常，企业的固定资产具有价值较高，使用周期较长，使用地点较分散，流动性较强和管理难度大等特点。越来越多的企业开始重视固定资产的管理，因为固定资产在企业运营中发挥的作用越来越大。随着企业固定资产数量和种类的日益增多，管理难度也随之增加。当下很多企业都在想方设法节约成本。固定资产占用企业大量资金，数量大、种类多、主要用途广，是企业节约成本的首要考虑因素。但传统的管理方式，在降本增效方面略显得吃力。由于管理不善而造成了固定资产流失、二次购买严重、存放地点不明、账实不一致等问题。

02

NER | 商品标题属性识别探索与实践

每天给你送来NLP技术干货！ ---- ©作者 | 康洪雨单位 | 有赞科技研究方向 | NLP/推荐算法来自 | PaperWeekly 最近一段时间在做商品理解的工作，主要内容是从商品标题里识别出商品的一些属性标签，包括不限于品牌、颜色、领型、适用人群、尺码等等。这类任务可以抽象成命名实体识别（Named Entity Recognition, NER）工作，一般用序列标注（Sequence Tagging）的方式来做，是比较成熟的方向。 ▲ 商品理解示例，品牌：佳丰；口味：蒜香味本文主要记录

02

AI 在爱奇艺视频广告中的探索

导读：本次分享的主题为 AI 在爱奇艺视频广告中的探索。AI 可以对视频内容、广告素材进行理解和加工，并应用于视频广告，尤其在广告的点位挖掘和生成、点位分析、素材创作等方面已产生价值，进而有益于广告库存提升和收入增加。本次分享的主要内容为：

03

陈丹琦团队最新力作：上下文学习在上下文“学到”了什么？

这段时间in-context learning真的很火，陈丹琦组最新的两篇文章都是ICL相关，今天我们拜读其中一篇：丹琦的硕士生、纽约大学准博士生Jane Pan的ACL小短文。

02

【EasyDL应用】图像识别解决海量家居图分类难题

EasyDL作为一款图像和声音的定制训练和服务平台，只要根据页面文字提示进行简单的拖拽操作，最快10分钟即可训练出定制化的深度学习模型。

03

聊聊自然语言处理NLP

自然语言处理(NLP)的正式定义：是一个使用计算机科学、人工智能(AI)和形式语言学概念来分析自然语言的研究领域。不太正式的定义表明：它是一组工具，用于从自然语言源(如web页面和文本文档)获取有意义和有用的信息。 NLP工具的实现一般是基于机器学习与深度学习、其它算法(Lucene Core)；基于前两者的实现是比较流行且持续在探索演进。

03

将图像转换位mnist数据格式

本文介绍了如何将图像转换为MNIST数据格式，并利用深度学习模型进行数字识别。首先介绍了MNIST数据格式的结构，然后通过Python代码实现了图像到MNIST数据的转换。最后，介绍了两种方法来实现模型对自己手写数字的识别，并指出了第二种方法的实时性更强。

06. OCR学习路径之CRNN文本识别

在了解了如何检测到文本之后，我们需要识别出检测文本内的文字信息。在文本识别完成之后，整个OCR光学字符识别的过程才算基本完成。那么，本次课程主要讲述识别文本的算法。

03

何恺明等在图像识别任务上取得重大进展，这次用的是弱监督学习

翻译 | Serene 编辑 | 阿司匹林出品 | 人工智能头条（公众号ID：AI_Thinker） 2017 年 7 月，最后一届 ImageNet 挑战赛落幕。为何对计算机视觉领域有着重要贡献的 ImageNet 挑战赛，会在 8 年后宣告终结？毕竟计算机系统在图像识别等任务上的准确率已经超过人类水平，每年一次突破性进展的时代也已经过去。近日，FAIR（Facebook AI Research）的 Ross Girshick 、何恺明等大神联手，在 ImageNet-1k 图像分类数据集上取得

04

港中文MMLab | 由简入难，即插即用：自步对比学习

今天，和大家分享一篇港中文MMLab发表于NeurIPS 2020的论文《Self-paced Contrastive Learning with Hybrid Memory for Domain Adaptive Object Re-ID》，该工作提出自步对比学习框架及混合记忆模型，旨在解决无监督及领域自适应表征学习中数据无法被充分挖掘的问题。

02

资源 | 谷歌发布人类动作识别数据集AVA，精确标注多人动作

选自Google Research 机器之心编译参与：路雪视频人类动作识别是计算机视觉领域中的一个基础问题，但也具备较大的挑战性。现有的数据集不包含多人不同动作的复杂场景标注数据，今日谷歌发布了精确标注多人动作的数据集——AVA，希望能够帮助开发人类动作识别系统。教机器理解视频中的人类动作是计算机视觉领域中的一个基础研究问题，对个人视频搜索和发现、运动分析和手势交流等应用十分必要。尽管近几年图像分类和检索领域实现了很大突破，但是识别视频中的人类动作仍然是一个巨大挑战。原因在于动作本质上没有物体那么明

07

Kaggler 看过来，CVPR 2018 Workshop 植物识别赛来袭

雷锋网 AI 研习社按，随着生活水平的提高，人们越来越关注身边的环境及植物，因此植物识别的需求也日益增多。但植物种类繁多，同一种植物也因生长周期、生长环境及基因变异影响，导致形态各有不同甚至差异极大，因此植物识别一直是人工智能识别领域极具挑战性的一个领域。植物的识别过程需要排除因光线、角度、背景、遮挡程度、清晰程度及植物形态细微差异等各种影响，才能完成对植物种类的精确识别。为了解决诸如此类的问题，CVPR 专门为数据科学家们准备了一个针对细粒度视觉分类的研讨会（FGVC5 workshop）。作为本次研

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭