understanding and enhancing mixed sample data augmentation - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

结果真的可靠吗？如何避免高置信度的错误预测 | 附源码

mix的中文是什么_mix是最小的意思吗

《mixup：BEYOND EMPIRICAL RISK MINIMIZATION》

论文周报 | 推荐系统领域最新研究进展，含RecSys, SIGIR, KDD等顶会论文

本文精选了上周（0710-0716）最新发布的20篇推荐系统相关论文，主要研究方向包括基于大语言模型的推荐系统、神经符号推荐系统、强化学习推荐系统、推荐系统公平性、推荐中的遗忘学习、序列推荐、图推荐等。

NLP 中的通用数据增强方法及针对 NER 的变种

本文结合 A Visual Survey of Data Augmentation in NLP 和最新的综述论文 A Survey of Data Augmentation Approaches for NLP，大致总结了目前 NLP 领域的通用数据增强方法和几种针对如 NER 的序列标注模型进行适配的变种方法，关于后者，重点介绍了基于 mixup 改进的 SeqMix 方法。

WBIR | DeepSTAPLE：UDA任务下学习多模态配准质量

上面的论文formulate the data parameter and curriculum learning approach as a modification altering the logits input of the loss function.

使用YOLOv10进行自定义目标检测

YOLO（You Only Look Once）是一种流行的物体检测算法，以其速度和准确性而闻名。与涉及生成区域提案然后对其进行分类的多阶段过程的传统方法不同，YOLO 将物体检测框架化为单个回归问题，只需一次评估即可直接从完整图像中预测边界框和类别概率。

2020年6月100篇最新GAN论文汇总

据不完全统计，GAN在CVPR2020上超115篇之多；其中，可看到GAN在朝着无监督/自监督/弱监督/半监督、少样本/单样本/零样本、多模态、3D、可解释性/可控性、对抗/安全，以及更广泛的跨学科场景应用方向中不断靠拢。此外，每个月新挂在arxiv上的GAN相关论文也好几十多，来看看GAN在过去的6月都干了些啥吧！

每日学术速递8.15

1.MiAMix: Enhancing Image Classification through a Multi-stage Augmented Mixied Sample Data Augmentation Method

Alexnet总结/论文笔记

使用Keras上的分段模型和实施库进行道路检测

在本文中，将展示如何编写自己的数据生成器以及如何使用albumentations作为扩充库。与segmentation_models库一起，它为Unet和其他类似unet的架构提供了数十个预训练。有关完整代码，请访问Github。

干货 | Active Learning: 一个降低深度学习时间，空间，经济成本的解决方案

本文系作者投稿作品作者 | Zongwei Zhou（周纵苇）大数据文摘欢迎各类优质稿件请联系tougao@bigdatadigest.cn 在深度学习研究应用中，有这样两个常见的场景：一共手头有100个未标记样本，和仅仅够标记10个样本的钱，老板说，通过训练这十个标记的样本，能接近甚至达到训练100个样本的performance；手头有了一个已经在100个样本中训练完的分类器，现在又来了100个新标记的样本，老板说，只给提供够训练10个样本的计算机；或者只给你提供够训练10个样本的时间，让分类器

论文周报[0624-0630] | 推荐系统领域最新研究进展(16篇)

本文精选了上周（0624-0630）最新发布的16篇推荐系统相关论文，主要研究方向包括高效课程推荐、图推荐、多模态食物推荐、个性化多场景多任务联邦推荐、语言理解增强推荐、序列推荐、跨域推荐、去偏推荐、大模型可解释推荐、轻量化嵌入推荐基准、点击率预估等。

一文综述生成更多图像训练数据的方法｜视觉进阶

像Google和Microsoft这样的大公司在图像识别方面已经超越了人类基准[1，2]。平均而言，人类大约有5％的时间在图像识别任务上犯了错误。截至2015年，微软的图像识别软件的错误率达到4.94％，与此同时，谷歌宣布其软件的错误率降低到4.8％[3]

手把手入门教程：YOLOv8如何训练自己的数据集，交通信号灯识别

Ultralytics YOLOv8是Ultralytics公司开发的YOLO目标检测和图像分割模型的最新版本。YOLOv8是一种尖端的、最先进的（SOTA）模型，它建立在先前YOLO成功基础上，并引入了新功能和改进，以进一步提升性能和灵活性。它可以在大型数据集上进行训练，并且能够在各种硬件平台上运行，从CPU到GPU。

Active Learning: 一个降低深度学习时间，空间，经济成本的解决方案

下面要介绍的工作发表于CVPR2017（http://cvpr2017.thecvf.com/），题为“Fine-tuning Convolutional Neural Networks for

论文周报 | 推荐系统领域最新研究进展，含SIGIR、WWW、CHI等顶会论文

本文精选了上周（0417-0423）最新发布的30篇推荐系统相关论文，主要的研究领域为会话推荐和序列推荐，所利用的技术包括遗忘学习、注意力机制、提示学习、去偏学习、长尾学习、图神经网络、对比学习、扩散模型、多任务学习、ChatGPT、ODE等。

AI Hair Online Free Applications: Virtual Hairstyling Made Easy!

In recent years, the world of hairstyling has witnessed a significant transformation with the advent of AI hair online free applications. These innovative tools harness the power of artificial intelligence and machine learning algorithms to revolutionize virtual hairstyling. With just a few clicks, users can virtually try out an array of hairstyles without actually cutting or coloring their hair. The convenience, accessibility, and potential for personalization have made these applications immensely popular among individuals looking to experiment with new looks. This article delves into the world of AI hair online free applications, exploring their advantages, limitations, and future prospects in the realm of hairstyling.

论文周报 | 推荐系统领域最新研究进展，含WWW, SIGIR, AAAI等顶会论文

本文精选了上周（0508-0514）最新发布的24篇推荐系统相关论文，主要研究方向包括大型语言模型赋能推荐系统、对话推荐系统、图推荐系统、隐私保护推荐系统、工业界推荐系统（来自谷歌、亚马逊、阿里）等。

23 | 使用PyTorch完成医疗图像识别大项目：优化数据

上一小节修改了我们的评估指标，然而效果并没有什么变化，甚至连指标都不能正常的输出出来。我们期望的是下面这种样子，安全事件都聚集在左边，危险事件都聚集在右边，中间只有少量的难以判断的事件，这样我们的模型很容易分出来，错误率也会比较低。

25 | 使用PyTorch完成医疗图像识别大项目：分割模型实现

前面已经把分割模型的数据处理的差不多了，最后再加一点点关于数据增强的事情，我们就可以开始训练模型了。

深度学习中的数据增强技术：Augmentation

数据增强（Data Augmentation）是一种通过利用算法来扩展训练数据的技术。人工智能三要素之一为数据，但获取大量数据成本高，但数据又是提高模型精度和泛化效果的重要因素。当数据量不足时，模型很容易过拟合，精度也无法继续提升，因此数据增强技术应运而生：利用算法，自动增强训练数据。

机器之心ACL 2022论文分享会干货集锦，6月邀你来CVPR分享会

作为国际最受关注的自然语言处理顶级会议，每年的 ACL 都吸引了大量华人学者投稿、参会。今年的 ACL 大会已是第 60 届，于 5 月 22-5 月 27 日期间举办。为了给国内 NLP 社区的从业人员搭建一个自由轻松的学术交流平台，2022 年 5 月 21 日，机器之心举办了「ACL 2022 论文分享会」线上学术交流活动。本次 ACL 论文分享设置了 Keynote、论文分享、企业招聘等环节，就业内关注的 Transformer、大规模预训练模型等 NLP 热门主题邀请顶级专家、论文作者与观众

CVPR 2022 论文和开源项目合集

📷 向AI转型的程序员都关注了这个号👇👇👇 机器学习AI算法工程公众号：datayx 【CVPR 2022 论文开源目录】 Backbone CLIP GAN NAS NeRF Visual Transformer 视觉和语言(Vision-Language) 自监督学习(Self-supervised Learning) 数据增强(Data Augmentation) 目标检测(Object Detection) 目标跟踪(Visual Tracking) 语义分割(Semantic Segment

7 Papers & Radios | 扩散模型只用文字PS照片；MIT泊松流生成模型击败扩散模型

论文 1：Fast Charging of Energy-dense Lithium-ion Batteries

论文周报 | 推荐系统领域最新研究进展，含WWW、ICDE、CIKM等顶会论文

1. Dually Enhanced Propensity Score Estimation in Sequential Recommendation, CIKM2022

99行深度学习代码训练自动驾驶游戏

deep learning in 2017 is magical. We get to apply immensely complex algorithms to equally complex problems without having to spend all our time writing the algorithms ourselves. Instead, thanks to libraries like TensorFlow and Keras, we get to focus on the fun stuff: model architecture, parameter tuning and data augmentation.

NLP提效，除了选择合适的模型，就是数据增强了

如何用有限的数据做出最佳的效果？除了一个优秀的模型以外，最有效的方法就是做数据增强了。自然语言处理(NLP)不同于图像，可以做裁剪，反转，缩放等操作来增强，而是有文本特别的处理方式。这篇论文《CODA: CONTRAST-ENHANCED AND DIVERSITYPROMOTING DATA AUGMENTATION FOR NATURAL LANGUAGE UNDERSTANDING》提出的CoDA方案号称能在Roberta-large上平均提升2.2%的效果，那我们就来看看这篇到底提出了哪些方法吧。

Pytorch自动混合精度训练模板

GitHub 仓库地址：https://github.com/yanqiangmiffy/amp-pytorch

新增21篇！ | CVPR 2019 论文实现代码

大家赶紧看起来啦！《C3AE: Exploring the Limits of Compact Model for Age Estimation》(CVPR 2019) GitHub地址：https://github.com/vicwer/C3AE_Age_Estimation 《BubbleNets: Learning to Select the Guidance Frame in Video Object Segmentation by Deep Sorting Frames》(CVPR 2019

TryOnDiffusion-Google最强虚拟试衣App

深度学习样本生成data augmentation

用于数据增强的十个Python库

数据增强是人工智能和机器学习领域的一项关键技术。它涉及到创建现有数据集的变体，提高模型性能和泛化。Python是一种流行的AI和ML语言，它提供了几个强大的数据增强库。在本文中，我们将介绍数据增强的十个Python库，并为每个库提供代码片段和解释。

一文看尽21篇目标检测最新论文（腾讯/Google/商汤/旷视/清华/浙大/CMU/华科/中科院等）

CVer 有几天没更新论文速递了，主要是这段时间的论文太多，而且质量较高的论文也不少，所以为了方便大家阅读，我已经将其中的目标检测（Object Detection）论文整理出来。本文分享的目标检测论文将同步推送到 github上，欢迎大家 star/fork（点击阅读原文，也可直接访问）：

ICLR2023推荐系统投稿论文集锦

今年ICLR会议已经把审稿意见放出来了，特此整理了一下关于推荐系统相关的论文，总共筛选出24篇。值得说明的是，之前整理的顶会论文都是正式被接收的，比如NeurlPS2022推荐系统论文集锦与CIKM2022推荐系统论文集锦。这次由于ICLR是Open Review的，所以目前下文所列出的论文列表不是最终的接收列表，而是投稿列表。正因为如此，我们可以看到每篇论文的投稿过程，了解在投稿过程中所关注论文的审稿意见以及评分，并可以学习一下在投稿过程中如何与审稿人进行亲切友好的battle。下文整理了每篇文章的标题、目前获得的评分、论文链接以及论文摘要。大家可以通过链接获取论文的详细评审意见以及论文的原始文件。

NLP中的少样本困境问题探究

在医疗、金融、法律等领域，高质量的标注数据十分稀缺、昂贵，我们通常面临少样本低资源问题。本文从「文本增强」和「半监督学习」这两个角度出发，谈一谈如何解决少样本困境。

文本增强、半监督学习，谁才是 NLP 少样本困境问题更优的解决方案？

时至今日，深度学习领域有哪些值得追踪的前沿研究？

这个问题是2020年新提出来的，我觉得非常有参考和学习价值。AI方向本身就是一个多融合的领域，将基础性知识迁移应用到各个子方向，其实也是目前一大主流。本文主要分享深度学习的前沿研究，下次会特别分享计算机视觉方向的前沿研究。

ICLR2023推荐系统投稿论文集锦

IJCAI2024推荐系统相关论文整理

第33届国际人工智能联合会议（International Joint Conference on Artificial Intelligence, 简称为IJCAI）是人工智能领域顶级的国际学术会议之一，也是CCF-A类会议。今年的IJCAI将于2024年8月03-09日在韩国济州岛举办。在今年的5461篇投稿论文中，有799篇大约14.63%的论文被接收，其中跟推荐系统相关的论文大约16篇。另外，跟（大）语言模型相关的论文40篇。

小样本学习及其在美团场景中的应用

美团的各个业务有着丰富的NLP场景，而这些场景中模型的构建需要很多的标注资源，成本很高。小样本学习致力于在数据资源稀少的情况下训练出比较好的模型。本文从主动学习、数据增强、半监督学习、领域迁移、集成学习&自训练几个方向介绍了现有的一些方法，并在美团场景进行了实验，效果上也取得了一定的提升。希望能对从事相关研究的同学有所帮助或者启发。

搜索、推荐、广告中的曝光偏差问题

机器学习本质上是在学习数据的分布, 其有效性的假设是模型 training 和 serving 时的数据是独立同分布(Independent and Identically Distributed, IID) 的，但是在实际应用中，由于采样有偏、具体场景等约束， training 的样本与 serving 时的样本并不是 IID 的。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐