开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

根据类别对部分训练集应用不同的数据增强

是指在进行机器学习或深度学习模型训练时，针对不同类别的样本数据，采取不同的数据增强方法，以提高模型的泛化能力和准确性。

数据增强是一种通过对原始数据进行各种变换和扩充，生成新的样本数据集的方法。它可以在一定程度上缓解数据不平衡和过拟合问题，增加训练样本的多样性，提高模型的泛化能力。

对于分类任务，根据类别对部分训练集应用不同的数据增强可以有以下几种常见方法：

图像数据增强：
- 翻转：对于左右翻转和上下翻转，可以在一定程度上增加数据的多样性。
- 平移和缩放：通过对图像进行平移和缩放操作，可以生成不同位置和尺度的样本。
- 旋转：通过对图像进行旋转操作，可以生成不同角度的样本。
- 剪切：通过对图像进行剪切操作，可以生成不同位置和大小的样本。
- 对比度和亮度调整：通过调整图像的对比度和亮度，可以生成不同亮度和对比度的样本。

文本数据增强：
- 同义词替换：将文本中的部分词语替换为它们的同义词，以增加语义多样性。
- 随机插入和删除：随机插入和删除文本中的词语，以增加文本长度和不同组合的样本。
- 错误拼写：对文本中的部分词语进行错误拼写，模拟输入错误的情况。
音频数据增强：
- 音频速度调整：通过调整音频的播放速度，可以生成不同语速的样本。
- 噪声添加：在原始音频中添加不同类型和强度的噪声，以增加背景环境多样性。
- 音调变换：通过调整音频的音调，可以生成不同音调和音高的样本。

根据不同的数据类型和任务需求，还可以结合其他数据增强方法，例如旋转、平移、缩放、扭曲、模糊等操作。

对于图像数据增强，推荐使用腾讯云的图像处理服务，具体介绍和使用方法可以参考腾讯云图像处理服务：https://cloud.tencent.com/product/ivp

对于文本数据增强，推荐使用腾讯云的自然语言处理服务，具体介绍和使用方法可以参考腾讯云自然语言处理服务：https://cloud.tencent.com/product/nlp

对于音频数据增强，推荐使用腾讯云的音视频处理服务，具体介绍和使用方法可以参考腾讯云音视频处理服务：https://cloud.tencent.com/product/mps

相关搜索:根据多个索引级别对绘图的不同部分进行着色将不同类型的列作为训练数据集使用在不同数据集上训练的cnn模型根据表中的类名将不同的数据集反序列化到不同的类中在每个时期对数据集的不同子集进行Tensorflow训练在训练实例分割时，在图像数据集上创建增强的最佳方法是什么？根据图像标题对表tr应用不同的类运行训练-测试拆分并获得不同数据集的模型精度重用具有不同数据集计算类的技术将数据集拆分成测试和训练集后出现“参数隐含不同的行数”错误 Orange:如何确保相同的PCA同时应用于训练数据集和测试数据集？根据测试数据的大小预测不同的类 SSRS报表根据条件在报表的不同部分显示数据深度学习:训练数据集和测试数据集之间具有相同数量标签的多类分类如何在Estimator的训练过程中动态加载数据集的新部分？K均值聚类在不同数据集上的结果根据条件在同一UITableView中显示不同的数据集如何使用具有不同特征维度的数据集来训练sklearn分类器？根据同一行中的不同列值选择数据集 Tensorflow训练精度和损失不同于对同一数据集的评估

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

为什么深度学习不能取代传统的计算机视觉技术？

译者 | 王柯凝编辑 | 周翔当你辗转于各种论坛时，相信会经常看到这样的问题：深度学习是否会取代传统的计算机视觉？或者说，当深度学习看起来如此有效时，是否还有必要研究传统的计算机视觉技术？这是一个非常好的问题。深度学习已经彻底改变了计算机视觉和人工智能这一领域，许多曾经看起来不可能解决的问题，深度学习都能够解决——尤其是在图像识别和分类问题上，机器已经超越人类（短链：http://t.cn/Rnzv2JX）。事实上，深度学习也强化了计算机视觉在行业中的重要地位。但是，深度学习对计算机视觉来说仅仅是

03

训练神经网络的7个技巧

神经网络模型使用随机梯度下降进行训练，模型权重使用反向传播算法进行更新。通过训练神经网络模型解决的优化问题非常具有挑战性，尽管这些算法在实践中表现出色，但不能保证它们会及时收敛到一个良好的模型。

01

CVPR 2022丨特斯联AI提出：用于视觉任务中无监督域自适应的类别对比

深度神经网络（Deep Neural Networks, DNNs）由于跨域不匹配（cross-domain mismatch），通常在新域表现不佳。而无监督域自适应（UDA）技术则可通过利用未标记的目标域样本缓解跨域不匹配问题。近日，特斯联科技集团首席科学家邵岭博士及合作者们提出了基于类别对比的新颖方法Category Contrast (CaCo)，并公布了所取得的最新研究成果。该方法在视觉UDA任务的实例判别之上引入了语义先验。该研究成果（标题为: Category Contrast for Uns

01

南大 & 上海 Ai Lab AWT 框架 | 革新视觉-语言模型的零样本与少样本学习能力，提升语义相关性挖掘！

近期在视觉语言模型（VLMs）方面取得了进展，这些模型经过大规模的网络图像文本对预训练，已经在各种分类任务中表现出显著的成功。VLMs被训练以将图像与相关的文本描述相联系。在标准协议（图1(a)）中，原始图像和类别名称被投射到一个联合视觉语言嵌入空间中，选择距离图像表示最近的类别作为预测结果。

01

用于时间序列预测的AutoML

最近，参加了AutoSeries —时间序列数据的AutoML竞赛，在其中设法获得40个竞争对手（决赛中的15个）的第一名。这篇文章是解决方案的概述。

02

数据受限的Kaggle图像分类的最新获奖技术

在本文中，将介绍用于课堂内Kaggle挑战的方法。花了大约两个星期的时间在挑战赛上，最终提交分数为0.97115，使在最终排行榜上排名第二。

02

ACL 2022 | 腾讯QQ浏览器实验室提出文本语义匹配训练策略，与PLM结合效率不减

机器之心报道作者：QQ浏览器实验室这篇ACL 2022研究提出了一个简单而有效的文本语义匹配的训练策略，通过分治的方式将关键词从意图中分离出来。作为国际最受关注的自然语言处理顶级会议，每年的 ACL 都吸引了大量华人学者投稿、参会。今年的 ACL 大会已是第 60 届，于 5 月 22-5 月 27 举办。受到疫情影响，国内 NLP 从业者参与大会受到很多限制。为了给国内 NLP 社区的从业人员搭建一个自由轻松的学术交流平台，机器之心在 5 月 21 日组织了「ACL 2022 线上论文分享会」。

01

详细解读TPH-YOLOv5 | 让目标检测任务中的小目标无处遁形

针对无人机捕获场景的目标检测是最近比较流行的一项任务。由于无人机在不同高度飞行，目标尺度变化较大，这样给模型的优化也带来了很大的负担。此外，在无人机进行高速低空飞行时，也会带来密集目标的运动模糊问题。

03

深度学习如何训练出好的模型

来源：机器学习AI算法工程本文约4800字，建议阅读10+分钟本文将会详细介绍深度学习模型的训练流程。深度学习在近年来得到了广泛的应用，从图像识别、语音识别到自然语言处理等领域都有了卓越的表现。但是，要训练出一个高效准确的深度学习模型并不容易。不仅需要有高质量的数据、合适的模型和足够的计算资源，还需要根据任务和数据的特点进行合理的超参数调整、数据增强和模型微调。在本文中，我们将会详细介绍深度学习模型的训练流程，探讨超参数设置、数据增强技巧以及模型微调等方面的问题，帮助读者更好地训练出高效准确的深度学习模型

02

【经验帖】深度学习如何训练出好的模型

数据质量：数据应该是准确，完整，无误，且具有代表性。如果数据集有错误或缺失，将会影响模型的性能，选择分辨率越高肯定对模型是越好的，但是也要考虑到模型训练占用的内存够不够，因为分辨率越高，数据量就越大

01

基于一致性的半监督语义分割方法：刷新多项SOTA，还有更好泛化性

机器之心专栏机器之心编辑部在本工作中，来自阿德莱德大学、乌鲁姆大学的研究者针对当前一致性学习出现的三个问题做了针对性的处理, 使得经典的 teacher-student 架构 (A.K.A Mean-Teacher) 在半监督图像切割任务上得到了显著的提升。该研究已被计算机视觉顶会 CVPR 2022 大会接收，论文标题为《Perturbed and Strict Mean Teachers for Semi-supervised Semantic Segmentation》：文章地址：https

02

基于一致性的半监督语义分割方法：刷新多项SOTA，还有更好泛化性

点击上方↑↑↑“OpenCV学堂”关注我来源：公众号机器之心授权在本工作中，来自阿德莱德大学、乌鲁姆大学的研究者针对当前一致性学习出现的三个问题做了针对性的处理, 使得经典的 teacher-student 架构 (A.K.A Mean-Teacher) 在半监督图像切割任务上得到了显著的提升。该研究已被计算机视觉顶会 CVPR 2022 大会接收，论文标题为《Perturbed and Strict Mean Teachers for Semi-supervised Semantic Segmen

02

农作物地块范围识别（图像分割）

来源：机器学习AI算法工程、知乎@Now more本文约5500字，建议阅读15分钟本文为你介绍以薏仁米作物识别以及产量预测为比赛命题，及对对应获奖的开发算法模型。农作物的资产盘点与精准产量预测是实现农业精细化管理的核心环节。当前，我国正处于传统农业向现代农业的加速转型期，伴随着农业的转型升级，政府宏观决策、社会各界对农业数据的需求不断增加，现有农业统计信息的时效性与质量，已不足以为市场各主体的有效决策提供科学依据。在农作物资产盘点方面，传统的人工实地调查的方式速度慢、劳动强度大，数据采集质量受主观因素

02

FASA: Feature Augmentation and Sampling Adaptationfor Long-Tailed Instance Segmentation

最近的长尾实例分割方法在训练数据很少的稀有目标类上仍然很困难。我们提出了一种简单而有效的方法，即特征增强和采样自适应（FASA），该方法通过增强特征空间来解决数据稀缺问题，特别是对于稀有类。特征增强（FA）和特征采样组件都适用于实际训练状态——FA由过去迭代中观察到的真实样本的特征均值和方差决定，我们以自适应损失的方式对生成的虚拟特征进行采样，以避免过度拟合。FASA不需要任何精心设计的损失，并消除了类间迁移学习的需要，因为类间迁移通常涉及大量成本和手动定义的头/尾班组。我们展示了FASA是一种快速、通用的方法，可以很容易地插入到标准或长尾分割框架中，具有一致的性能增益和很少的附加成本。

01

机器学习中的数据不平衡解决方案大全

在机器学习任务中，我们经常会遇到这种困扰：数据不平衡问题。数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时，以总体分类准确率为学习目标的传统分类算法会过多地关注多数类，从而使得少数类样本的分类性能下降。绝大多数常见的机器学习算法对于不平衡数据集都不能很好地工作。本文介绍几种有效的解决数据不平衡情况下有效训练有监督算法的思路： 1、重新采样训练集可以使用不同的数据集。有两种方法使不平衡的数据集来建立一个平衡的数据集——欠采样和过采样。 1.1.

04

【无痛涨点】目标检测优化的实用Trick

写这篇文章就是因为up主的邀请，然后分享一下自己工作时候总结的一些经验和技巧，不一定适用别的网络，有的还可能会有反作用，所以也就是给大家提供一个思路，欢迎拍砖吧，因为都是公司数据，分享试验结果也比较麻烦，所以大家看个思路就好。

02

如何解决机器学习中的数据不平衡问题？

在机器学习任务中，我们经常会遇到这种困扰：数据不平衡问题。数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时，以总体分类准确率为学习目标的传统分类算法会过多地关注多数类，从而使得少数类样本的分类性能下降。绝大多数常见的机器学习算法对于不平衡数据集都不能很好地工作。本文介绍几种有效的解决数据不平衡情况下有效训练有监督算法的思路： 1、重新采样训练集可以使用不同的数据集。有两种方法使不平衡的数据集来建立一个平衡的数据集——欠采样和过采样。 1.1. 欠采样欠采样是通过减少丰富类的大小来

09

开发 | 如何解决机器学习中的数据不平衡问题？

在机器学习任务中，我们经常会遇到这种困扰：数据不平衡问题。数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时，以总体分类准确率为学习目标的传统分类算法会过多地关注多数类，从而使得少数类样本的分类性能下降。绝大多数常见的机器学习算法对于不平衡数据集都不能很好地工作。本文介绍几种有效的解决数据不平衡情况下有效训练有监督算法的思路： 1、重新采样训练集可以使用不同的数据集。有两种方法使不平衡的数据集来建立一个平衡的数据集——欠采样和过采样。 1.1. 欠采样欠采样是通过减少丰富类的大小来平衡

图对比学习的最新综述

对比学习作为一种自监督式的深度学习范式,在计算机视觉、自然语言处理等领域取得了瞩目的成绩。受这些成功的对比学习模型的启发,近年来大量研究者尝试将其拓展到图数据上,这为推动图对比学习的发展提供了坚实的基础。该领域现有的综述主要关注于传统的图自监督学习任务,而缺少对图对比学习方法的梳理和归纳。为了更好地帮助相关领域的研究者,该文梳理了近些年来的图对比学习模型,通过将现有工作归纳到一个统一的框架下,突出其发展脉络。最后该文总结了图对比学习常用的数据集和评价指标,并展望了该领域未来的发展方向。

01

带有注意力RPN和多关系检测器的小样本目标检测网络（提供源码和数据及下载）

传统的目标检测方法通常需要大量的训练数据，并且准备这样高质量的训练数据是劳动密集型的（工作）。在今天分享中，研究者提出了少量样本的目标检测网络，目的是检测只有几个训练实例的未见过的类别对象。新提出的方法核心是注意力RPN和多关系模块，充分利用少量训练样本和测试集之间的相似度来检测新对象，同时抑制背景中的错误检测。

02

kaggle图像分割实战要点和技巧总结

想象一下，如果你能得到所有的tips和tricks，你需要去参加一个Kaggle比赛。我已经超过39个Kaggle比赛，包括：

03

从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

想象一下，如果你能得到所有的tips和tricks，你需要去参加一个Kaggle比赛。我已经超过39个Kaggle比赛，包括：

02

从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks

来源：AI公园深度学习爱好者本文约2500字，建议阅读5分钟作者参加了39个Kaggle比赛，总结了非常多的技巧和经验。想象一下，如果你能得到所有的tips和tricks，你需要去参加一个Kaggle比赛。我已经超过39个Kaggle比赛，包括： Data Science Bowl 2017 – $1,000,000 Intel & MobileODT Cervical Cancer Screening – $100,000 2018 Data Science Bowl – $100,000 Air

02

分割一切后，Segment Anything又能分辨类别了：Meta/UTAustin提出全新开放类分割模型

机器之心专栏机器之心编辑部前几日，Meta 推出了「分割一切」AI 模型 Segment Anything，令网友直呼 CV 不存在了？！而在另一篇被 CVPR 2023 收录的论文中，Meta、UTAustin 联合提出了新的开放语言风格模型（open-vocabulary segmentation, OVSeg），它能让 Segment Anything 模型知道所要分隔的类别。从效果上来看，OVSeg 可以与 Segment Anything 结合，完成细粒度的开放语言分割。比如下图 1 中识别

02

农作物地块范围识别(图像分割)

向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程公众号：datayx 农作物的资产盘点与精准产量预测是实现农业精细化管理的核心环节。当前，我国正处于传统农业向现代农业的加速转型期，伴随着农业的转型升级，政府宏观决策、社会各界对农业数据的需求不断增加，现有农业统计信息的时效性与质量，已不足以为市场各主体的有效决策提供科学依据。在农作物资产盘点方面，传统的人工实地调查的方式速度慢、劳动强度大，数据采集质量受主观因素影响大，统计数据有较大的滞后性，亟待探索研究更高效准确度更高的农业调查统计技术。

02

台大提出 DQ-DETR | 用简简单单 3 步改进 DETR 即可完成小目标检测的大跨越

卷积神经网络（CNNs）在处理RGB语义和空间纹理特征方面具有优势。大多数目标检测方法主要基于CNNs。例如，Faster R-CNN 引入了一个区域 Proposal 网络来生成潜在的目标区域。FCOS 应用一个中心预测分支来提高边界框的质量。

01

AAAI 2023实用AI挑战赛冠军方案分享

2023年1月，AAAI 2023 实用AI挑战赛落下帷幕。我所在的team_kppkkp队获得总榜冠军。在此，分享一下我们队本次比赛的方案，抛砖引玉。

03

Semi-supervised learning-based satellite remote sensing object detection method for power transmissi

众所周知，随着电网的日益复杂，传统的输电塔人工测量方法已经失效，无法满足安全稳定运行的要求。尽管卫星遥感技术的发展为输电塔的高效稳定测量提供了新的前景，但仍有许多问题需要解决。由于恶劣的气候和成像设备的限制，遥感图像中的一些输电塔目标是模糊的，这使得生成数据集和实现高精度输电塔目标检测变得极其困难。为了进一步提高发射塔的检测精度，首次将基于暗通道先验的图像增强算法应用于遥感图像，提高了图像的可解释性。然后，考虑到增强图像中仍有一些传输塔无法手动标记，采用了一种基于伪标记的半监督学习方法来最大限度地利用现有数据。基于这一高质量的数据集，利用移动倒瓶颈卷积和可变形卷积构建了一个传输塔卫星遥感目标检测模型。最后，根据我国某地区的卫星遥感图像数据集进行了烧蚀和对比实验。实验结果表明，图像增强和半监督学习方法都能提高检测精度，与现有主流模型相比，该方法性能更好。

01

Nat Commun｜增强的用于直接合成和单步逆合成的NLP的Transfermer模型

今天给大家介绍的是NATURE COMMUNICATIONS上有关数据增强的文章"State-of-the-art augmented NLP transformer models for direct and single-step retrosynthesis"

02

Yann LeCun团队新研究成果：对自监督学习逆向工程，原来聚类是这样实现的

自监督学习（SSL）在最近几年取得了很大的进展，在许多下游任务上几乎已经达到监督学习方法的水平。但是，由于模型的复杂性以及缺乏有标注训练数据集，我们还一直难以理解学习到的表征及其底层的工作机制。此外，自监督学习中使用的 pretext 任务通常与特定下游任务的直接关系不大，这就进一步增大了解释所学习到的表征的复杂性。而在监督式分类中，所学到的表征的结构往往很简单。

04

AI助你应对“你（扔的）是那种垃圾”的灵魂拷问

近期垃圾分类成为了一个热门话题，原来直接一次性扔掉的垃圾，现在都需要分门别类进行投放。从今年7月1日起，新的《上海市生活垃圾管理条例》正式开始施行，号称史上最严的垃圾分类就要来了。我们以后在扔垃圾前都要先将垃圾仔细分成可回收物、有害垃圾、湿垃圾和干垃圾四个类别，如果分错还会被罚款。

04

fasterrcnn深度学习口罩检测

当我们输入一张图片，首先传达给backbone网络进行特征提取，backbone的选择不是唯一的，可以使用resnet50,101等等，其目的就是为了得到图像的大小较小，但却很深的特征层

05

不加样本就能做数据增强？还能提效？

数据增强早已被广泛应用在提升模型泛化能力上，通过"创造"额外的样本输入给模型使得模型更加鲁棒。近期又有隐式数据增强，不是通过直接创造样本来提高模型效果，那隐式数据增强究竟是怎么做的呢？

02

被垃圾分类逼疯？AI或许能拯救你

垃圾分类可以更好地保护我们的环境卫生，为了让大家能够正确对垃圾进行分类，官方发布了垃圾分类指南，列举了每种类别对应的常见垃圾，大家可以对照着进行分类投放。此外，脑洞大开的网友们也另辟蹊径，提供了各种有意思的分类思路。

03

经典 | 深度学习的7大实用技巧

编译 | AI科技大本营参与 | 林椿眄编辑 | 谷磊对于许多具有挑战性的现实问题，深度学习已经成为最有效的解决方法。例如，对于目标检测，语音识别和语言翻译等问题，深度学习能够表现出最佳的性能。许多人认为深度神经网络(DNNs)是一种神奇的黑盒子，我们只需要输入一堆数据，网络就能够输出我们所要的解决方案！但是，在实践中我们往往会碰到更多、更复杂的问题。在设计网络模型并将DNNs应用到一个特定的问题上，往往会遇到很多挑战。对于某一特定的实际问题，我们需要根据实际应用，正确地设计并训练网络

07

首个X光下的小样本检测基准和弱特征增强网络，北航、讯飞新研究入选ACM MM 2022

机器之心专栏机器之心编辑部本文中，北航、讯飞的研究者们构建了首个 X 光场景下的小样本检测数据集 ——X-ray FSOD 数据集。同时又提出了微弱特征增强网络，为小样本检测带来新的思考。小样本检测任务（few-shot detection）旨在解决真实工业场景中样本获取困难情况下模型泛化能力差的痛点，尝试通过少量的训练样本获得具有泛化能力的模型。小样本检测任务一直是学术界研究的焦点，传统的方法主要聚焦于自然光数据，在常见的 COCO 数据集上进行评估。由于自然光数据样本通常具有颜色鲜艳、目标清晰等特

02

图解BERT模型：从零开始构建BERT

本文首先介绍BERT模型要做什么，即：模型的输入、输出分别是什么，以及模型的预训练任务是什么；然后，分析模型的内部结构，图解如何将模型的输入一步步地转化为模型输出；最后，我们在多个中/英文、不同规模的数据集上比较了BERT模型与现有方法的文本分类效果。 1. 模型的输入/输出 BERT模型的全称是：BidirectionalEncoder Representations from Transformer。从名字中可以看出，BERT模型的目标是利用大规模无标注语料训练、获得文本的包含丰富语义信息的Repre

Nearest-Neighbor Contrastive Learning of Visual Representations

With a Little Help from My Friends: Nearest-Neighbor Contrastive Learning of Visual Representations

02

（数据科学学习手札30）朴素贝叶斯分类器的原理详解&Python与R实现

要介绍朴素贝叶斯（naive bayes）分类器，就不得不先介绍贝叶斯决策论的相关理论：

「合并」样本和标签? IBM 为多标签小样本图像分类带来新进展！| CVPR 2019

AI 科技评论按：目前大多数关于图像小样本分类的研究工作都是研究单标签场景，每个训练图像只包含一个对象，然而现实中的场景中以多对象多标签居多，因此对于多标签小样本的图像分类研究更具现实意义。IBM 的研究人员对多标签小样本的图像分类进行了研究，并在 CVPR 2019 大会上进行了论文分享，相关成果发表在 IBM 官网博客上，AI 科技评论编译如下。

03

大规模食品图像识别：T-PAMI 2023论文解读

美团基础研发平台视觉智能部与中科院计算所展开科研课题合作，共同构建大规模数据集Food2K，并提出渐进式区域增强网络用于食品图像识别，相关研究成果已发表于T-PAMI 2023。

03

2021 BDCI 华为零售商品识别竞赛一等奖方案分享

【GiantPandaCV导语】上学期快结束的时候参加了华为和CCF组织的零售商品识别的比赛，队伍名称为GiantPandaCV队，比赛大约持续了两个月，期间从开始摸索MindSpore框架，配置环境，上手ModelArts花费了不少功夫。现在比赛终于告一段落，本文进行一下复盘。

01

训练AI要“什么自行车” 只用了1万辆小破车 | ICCV2021 VIPriors

对数据集进行标注会消耗大量的人力和资源，此外，只有少数几家科技巨头拥有数十亿的数据点和数以千计的昂贵的深度学习硬件GPU可供使用。

03

独家 | 机器学习中的四种分类任务（附代码）

分类是一项需要使用机器学习算法去学习如何根据问题域为示例分配类标签的任务。一个简单易懂的例子是将电子邮件分为“垃圾邮件”或“非垃圾邮件”。

02

减少yolo检测模型误检的优化和调整

数据集质量：确保你的训练数据集质量良好，包含足够多的代表性样本，并且标注准确无误。低质量的训练数据集可能导致模型学习到错误的特征，从而产生误报。

01

CVPR2022 | UCC：不确定性引导的十字头联合训练半监督语义切分

华为诺亚方舟实验室自动驾驶研究团队的最新自主研究成果《UCC: Uncertainty guided Cross-head Co-training for Semi-Supervised Semantic Segmentation》发表在计算机视觉领域的顶级会议CVPR 2022。

04

商汤、港中文&南洋理工提出K-Net：图像分割通用框架来啦！

【导读】一直以来，尽管语义分割、实例分割以及全景分割任务之间都有某种潜在的联系，但它们通常采用不同的网络框架来解决。本文首次探讨了语义分割中的卷积核概念是否同样适用于实例分割，以及更广泛的全景分割。为此，商汤&南洋理工大学提出了一个统一、简单、有效的框架K-Net。具体而言，它可以通过一组动态权重更新的卷积核来对实例和语义类别信息进行正确分割，然后，采用互相匹配的策略为每个卷积核分配学习目标，并进行端到端的训练。K-Net在全景分割任务上超越了所有当前最先进的单模型，并在MS COCO上实现了52.1% PQ，在语义分割任务上也超越了所有的单模型，并在ADE20K上实现了54.3% mIoU。最后，在实例分割任务上，它在MS COCO数据集上的性能表现与Cascade Mask R-CNN相当，但是，推理速度却比它快60%-90%。

04

多波段遥感影像数据增广怎么做？教你用PaddleSeg处理多波段遥感任务

【飞桨开发者说】陈奕州，飞桨开发者技术专家（PPDE），PP SIG Model-CV 成员，重庆交通大学测绘科学与技术在读研究生。

06

Hybrid-PSC：基于对比学习的混合网络，解决长尾图片分类 | CVPR 2021

论文: Contrastive Learning based Hybrid Networks for Long-Tailed Image Classification

01

学界 | CMU&FAIR ICCV论文：通过传递不变性实现自监督视觉表征学习

选自arXiv 机器之心编译参与：路雪、黄小天通过自监督学习学习视觉表征在计算机视觉领域逐渐开始流行。本文提出可通过不变性的传递实现视觉表征自监督学习，该网络在多种识别任务中均表现不俗，在表面正常

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭