本文主要针对用户行为稀疏的问题,提出用户兴趣增强(UIE)的方法,从不同的角度使用基于流聚类和记忆网络生成的增强向量和个性化增强向量来增强用户兴趣,包括用户画像和用户历史行为序列。UIE不仅显著提高了兴趣稀疏用户的模型性能,而且显著提高了其他用户的模型效率。
标题: Enhancing User Interest based on Stream Clustering and Memory Networks in Large-Scale Recommender Systems 地址:https://arxiv.org/pdf/2405.13238 公司:腾讯
数据增强(DA)是减轻深度神经网络训练过程中过拟合的一种关键且非常有效的技术,这导致了更一般化和可靠的模型。然而,需要注意的是,现有的DA方法主要依赖于在训练过程中使用完全随机或人为设计的增强幅度,这可能导致次优的训练场景,并需要人类专家在给定新数据集时对超参数进行更多的调整工程。
【新智元导读】ICML2016今天进入课程讲座环节,DeepMind的资深科学家、AlphaGo作者之一的David Silver作了题为《深度增强学习》的报告。新智元带来本次报告的全部PPT。与前几
今天带来深度学习中的数据增强方法的下篇。我们将从以下几个方向入手。1,介绍一下什么是无监督的数据增强方法。2,简单介绍一下GAN生成数据的应用。3,介绍一下AutoAugment为代表的网络自动学习数据增强策略的方法。4,总结。
代码:https://github.com/liruihui/PointAugment.git
论文链接:http://openaccess.thecvf.com/content_cvpr_2018/papers/Sharma_Classification-Driven_Dynamic_Image_CVPR_2018_paper.pdf
他们提出基于深度学习优化光照的暗光下的图像增强模型,用端到端网络增强曝光不足的照片。
这篇博客主要介绍之前看过的一些图像增强的论文,针对普通的图像,比如手机拍摄的那种,比低光照图像增强任务更简单。
AlphaGo在与李世石或柯洁对弈过程中有个休息流程。此时人类选手利用这段时间充分放松思维,让自己从上一盘比赛的剧烈思维活动中抽身而出,让身体和思维获得恢复以便再战。但此时AlphaGo并没有休息,而是抓住这段时间自己跟自己对弈,在对方休息时,它可能又让自己下了好几万盘棋,于是自己的下棋能力又有了新的提升。当下一盘棋开始时,李世石和柯洁唯一的变化是由体力的下降而变弱了,而AlphaGo通过自我对弈增强了,如此此消彼长,最终结局自然不难预料。
来源:计算机视觉与机器学习作者丨木瓜子@知乎 链接丨https://zhuanlan.zhihu.com/p/82352961本文约7900字,建议阅读10+分钟文章介绍了近年来比较经典的图像增强模型,并分析其优缺点。 这篇博客主要介绍之前看过的一些图像增强的论文,针对普通的图像,比如手机拍摄的那种,比低光照图像增强任务更简单。 介绍 图像增强的定义非常广泛,一般来说,图像增强是有目的地强调图像的整体或局部特性,例如改善图像的颜色、亮度和对比度等,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图
图像增强的定义非常广泛,一般来说,图像增强是有目的地强调图像的整体或局部特性,例如改善图像的颜色、亮度和对比度等,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,提高图像的视觉效果。传统的图像增强已经被研究了很长时间,现有的方法可大致分为三类,空域方法是直接对像素值进行处理,如直方图均衡,伽马变换;频域方法是在某种变换域内操作,如小波变换;混合域方法是结合空域和频域的一些方法。传统的方法一般比较简单且速度比较快,但是没有考虑到图像中的上下文信息等,所以取得效果不是很好。 近年来,卷积神经网络在很多低层次的计算机视觉任务中取得了巨大突破,包括图像超分辨、去模糊、去雾、去噪、图像增强等。对比于传统方法,基于CNN的一些方法极大地改善了图像增强的质量。现有的方法大多是有监督的学习,对于一张原始图像和一张目标图像,学习它们之间的映射关系,来得到增强后的图像。但是这样的数据集比较少,很多都是人为调整的,因此需要自监督或弱监督的方法来解决这一问题。本文介绍了近年来比较经典的图像增强模型,并分析其优缺点。
今天给大家介绍的是来自爱丁堡大学的Antreas Antoniou等人在arXiv上发表的文章”DATA AUGMENTATION GENERATIVEADVERSARIAL NETWORKS”。该模型基于图像条件生成对抗网络,从源域获取数据并学习获取任何数据项并将其生成为生成其他类内数据项。由于这个生成过程不依赖于类本身,它可以应用于新颖的不可见的数据类。
不久前,我们为大家介绍了腾讯明眸这一利用腾讯云领先的编解码和媒体处理技术与AI技术融合打造而成的音视频技术品牌(攻城狮手记 | 既高清又低码?腾讯明眸帮你两者兼得)。接下来我们将通过三期文章,从AI智能处理、编解码优化和容器格式优化三个方面,进一步解读分享腾讯云音视频-明眸研究团队在多媒体领域前沿技术方面积累的经验和成果。 本期我们将先从深度学习AI画质增强开始,为大家分享腾讯明眸在AI方向上的探索及思考。 腾讯明眸核心能力展示 目前我们在画质增强的工作上通过结合深度学习网络,针对性的提出了一些
【新智元导读】 在新智元20万读者大调查的反馈中,不少读者朋友反映希望看到更多关于国内人工智能领域实验室及其研究项目的介绍。我们今天为大家带来的是中山大学人机物智能融合实验室(中大HCPLab)和他们“基于注意力机制学习的人脸幻构”的研究介绍。 我们希望能为读者朋友们介绍一些国内优秀的人工智能领域的实验室和他们的研究项目,今天为大家带来的是中山大学人机物智能融合实验室(中大HCPLab)和他们的“基于注意力机制学习的人脸幻构”研究。 中山大学人机物智能融合实验室介绍 中山大学人机物智能融合实验室(http:
腾讯云极速高清视频色彩增强技术方案基于深度学习技术,结合卷积网络、全连接网络和回归等算法,实现了通过自动化调整视频的亮度、对比度、饱和度来达到色彩增强的效果。 目前视频色彩自动增强的算法在深度学习领域遇到的问题在于没有有效的监督信息,由于需要提升的是人类视觉系统对视频色彩的主观感受, 而不是客观的信噪比明暗度等指标,因此在学术和工业界都没有形成成熟的方法来提升整体的色彩效果,也难以通过模拟真实场景来获取良好的色彩数据对用以模型的训练。而在落地性上,目前深度学习对色彩增强的方式没有考虑在视频应用
腾讯云音视频画质增强研究团队专注于多媒体技术领域的前沿前沿技术探索、研发、应用和落地。今天的新知系列课,我们邀请到了来自该研究团队的技术导师 —— 陈铭良,为大家介绍他们团队在媒体画质增强工作上的一些方法积累和能力优势。目前他们在画质增强的工作上积极跟进前沿的深度学习算法,并针对性的提出了一些适合于落地的解决方案。通过数据驱动的自动建模和基于AI的媒体处理,部分方法的效果已经超过了当前学术上的state-of-the-art,领先于竞品。 接下来的几周,每周四晚上7:30,我们都会在腾讯云音视频视频号
数据、算法、算力是人工智能发展的三要素。数据决定了Ai模型学习的上限,数据规模越大、质量越高,模型就能够拥有更好的泛化能力。然而在实际工程中,经常有数据量太少(相对模型而言)、样本不均衡、很难覆盖全部的场景等问题,解决这类问题的一个有效途径是通过数据增强(Data Augmentation),使模型学习获得较好的泛化性能。
很多实际的项目,我们都难以有充足的数据来完成任务,要保证完美的完成任务,有两件事情需要做好:(1)寻找更多的数据。(2)充分利用已有的数据进行数据增强,今天就来说说数据增强。
我们知道,AI模型的成功很大部分可以归因于对大数据的泛化。然而,在时间序列识别分类领域,许多数据集通常非常小。解决这个问题的一种方法是通过数据增强。最近来自日本九州大学的几位学者调查了时间序列的数据增强技术及其在时间序列分类中的应用,在Arxiv上发表了一篇综述。综述涵盖了随机转换、模式混合、生成模型和分解方法的数据增强模型,系统阐述了近些年数据增强方向的最新成果。
论文地址:http://jiaya.me/papers/photoenhance_cvpr19.pdf
数据增强也叫数据扩增,意思是在不实质性的增加数据的情况下,让有限的数据产生等价于更多数据的价值。
2016年AlphaGo计算机围棋系统战胜顶尖职业棋手李世石,引起了全世界的广泛关注,人工智能进一步被推到了风口浪尖。而其中的深度增强学习算法是AlphaGo的核心,也是通用人工智能的实现关键。本文将带领大家了解深度增强学习的前沿算法思想,领略人工智能的核心奥秘。 前言 深度增强学习(Deep Reinforcement Learning,DRL)是近两年来深度学习领域迅猛发展起来的一个分支,目的是解决计算机从感知到决策控制的问题,从而实现通用人工智能。以Google DeepMind公司为首,基于深度增强
众所周知,即使是目前最先进的神经网络模型,其本质上也是在利用一系列线性和非线性的函数去拟合目标输出。
首先给小白科普一下,所谓的R18,全称是Release-18。它是通信国际标准组织3GPP(第三代合作伙伴计划)所推出协议标准的一个版本。
这篇文章是对深度学习数据增强技术的全面回顾,具体到图像领域。这是《在有限的数据下如何使用深度学习》的第2部分。
Retinex模型是微光图像增强的有效工具。假设观测图像可以分解为反射率和光照。大多数现有的基于retinx的方法都为这种高度病态分解精心设计了手工制作的约束条件和参数,当应用于各种场景时,可能会受到模型容量的限制。在本文中,我们收集了一个包含低/正常光图像对的低光数据集(LOL),并提出了在该数据集上学习的深度视网膜网络,包括用于分解的解分解网和用于光照调整的增强网。在解压网络的训练过程中,分解的反射率和光照没有ground truth。该网络仅在关键约束条件下学习,包括成对低/正常光图像共享的一致反射率和光照的平滑度。在分解的基础上,通过增强网络对光照进行亮度增强,联合去噪时对反射率进行去噪操作。Retinex-Net是端到端可训练的,因此学习的分解本质上有利于亮度调整。大量实验表明,该方法不仅在弱光增强方面具有良好的视觉效果,而且能很好地表征图像的分解。
图像增强方法在数字图像处理中占有重要地位,它能够有效提高图像的视觉效果,增强图像的细节信息,从而在医学、遥感、工业检测等多个领域发挥重要作用
交通标志检测对于无人驾驶系统来说是一项具有挑战性的任务,尤其是多尺度目标检测和检测的实时性问题。在交通标志检测过程中,目标的规模变化很大,会对检测精度产生一定的影响。特征金字塔是解决这一问题的常用方法,但它可能会破坏交通标志在不同尺度上的特征一致性。而且,在实际应用中,普通方法难以在保证实时检测的同时提高多尺度交通标志的检测精度。 本文提出了一种改进的特征金字塔模型AF-FPN,该模型利用自适应注意模块(adaptive attention module, AAM)和特征增强模块(feature enhancement module, FEM)来减少特征图生成过程中的信息丢失,进而提高特征金字塔的表示能力。将YOLOv5中原有的特征金字塔网络替换为AF-FPN,在保证实时检测的前提下,提高了YOLOv5网络对多尺度目标的检测性能。 此外,提出了一种新的自动学习数据增强方法,以丰富数据集,提高模型的鲁棒性,使其更适合于实际场景。在100K (TT100K)数据集上的大量实验结果表明,与几种先进方法相比,本文方法的有效性和优越性得到了验证。
论文:https://www.sciencedirect.com/science/article/abs/pii/S156625352200210X
图像在较低的光照下拍摄往往存在亮度低、对比度差等问题,从而影响一些high-level任务,因此低光照图像增强的研究具有很强的现实意义。现有的方法主要分为两类,基于直方图均衡的方法和基于Retinex理论的方法。基于HE的方法主要是扩大图像的动态范围从而增强整幅图像的对比度,是一个全局的过程,没有考虑亮度的变换,可能会导致过度增强。基于Retinex的方法的关键是估计illumination map,是手工调整的,依赖于参数选择,此外这种方法不考虑去除噪声,甚至会放大噪声。现有的基于深度学习的方法没有显式地包含去噪过程甚至依赖于传统的去噪方法,取得的效果不是很好。
增强子作为一种重要的基因组顺式作用元件,在转录调控中发挥重要作用,参与很多的生物学过程,当然也包括了疾病的发生与发展。
验证是否过拟合的方法:画出loss曲线,如果训练集loss持续减小但是验证集loss增大,就说明是过拟合了。
之前在做光照对于高层视觉任务的影响的相关工作,看了不少基于深度学习的低光照增强(low-light enhancement)的文章[3,4,5,7,8,9,10],于是决定简单梳理一下。
选自arXiv 作者:Ekin D. Cubuk 等 机器之心编译 参与:Geek AI、路 近日,来自谷歌大脑的研究者在 arXiv 上发表论文,提出一种自动搜索合适数据增强策略的方法 AutoAugment,该方法创建一个数据增强策略的搜索空间,利用搜索算法选取适合特定数据集的数据增强策略。此外,从一个数据集中学到的策略能够很好地迁移到其它相似的数据集上。 引言 深度神经网络是强大的机器学习系统,当使用海量数据训练时,深度神经网络往往能很好地工作。数据增强是一种通过随机「增广」来提高数据量和数据多样性的
数据增强是提高图像分类器精度的有效技术。但是当前的数据增强实现是手工设计的。在本论文中,我们提出了AutoAugment来自动搜索改进数据增强策略。我们设计了一个搜索空间,其中一个策略由许多子策略组成,每个小批量的每个图像随机选择一个子策略。子策略由两个操作组成,每个操作都是图像处理功能,例如平移,旋转或剪切,以及应用这些功能的概率。我们使用搜索算法来找到最佳策略,使得神经网络在目标数据集上产生最高的验证准确度。我们的方法在ImageNet上获得了83.5%的top1准确度,比之前83.1%的记录好0.4%。在CIFAR-10上,我们实现了1.5%的错误率,比之前的记录好了0.6%。扩充策略在数据集之间是可以相互转换的。在ImageNet上学到的策略也能在其他数据集上实现显著的提升。
机器之心报道 编辑:小舟、泽南 英特尔在侠盗猎车手 5(GTA5)上测试了他们的图像增强新模型,该模型给出了令人印象深刻的结果。 GTA5 是一款经典的 3D 冒险游戏,它的画风是这样的: 画面接近真实,但少了一些质感...... 近日,来自英特尔的研究者给 GTA 做了一个画质增强补丁,先来看下效果: 左为 GTA 中的 3D 渲染图,右为英特尔新模型生成结果。 效果很不错,下面这一张画质增强的效果就更明显了,该模型处理后的画面宛如相机实拍: 在 3D 渲染领域,实时和真实感是两个关键要素。通常
GTA 也叫“侠盗猎车手”,是R星旗下一款超高人气动作冒险类游戏,目前已经发售至第五版。
5G Release 18是5G-Advanced的第一个版本,它包含许多增强功能,可提高5G网络的性能和功能。这些增强功能包括:
本文分享 AAAI 2022 论文『Low-Light Image Enhancement with Normalizing Flow』,由南洋理工大学和香港城市大学合作完成,该文针对弱光图像增强问题提出了一种新颖的流正则化模型LLFlow,并在多个数据集上达到SOTA性能。
近来关注了下近年火热起来的衣物布料增强,于是看了前段时间刚刚新鲜出炉的Adobe和miHoYo参与的这篇文章,这篇文章运用网络实现了低性能代价的衣物褶皱增强效果,效果也还算可以
文章:Small-Object Detection in Remote Sensing Images with End-to-End Edge-Enhanced GAN and Object Detector Network
近年来,卷积神经网络(CNN)的出现推动了目标检测领域的发展。大量的检测器被提出,针对基准数据集的性能也取得了令人满意的结果。然而,大多数现有的检测器都是在高质量图像和正常条件下进行研究的。而在实际环境中,往往存在许多恶劣的光照条件,如夜晚、暗光和曝光不足,导致图像质量下降,从而影响了检测器的性能。视觉感知模型使得自动系统能够理解环境并为后续任务(如轨迹规划)奠定基础,这需要一个稳健的目标检测或语义分割模型。
这是一篇单一图像对比度增强的论文,传统的单一图像对比度增强方法包括基于HE和Retinex理论,但由于自然场景的复杂性和单张图像包含的信息有限,往往很难产生高质量的结果。因此有了基于多曝光图像序列的图像增强,主要有多曝光图像融合(MEF)和高动态范围图像堆叠(stack-based HDR image),再加上色调映射,但这些序列图像中会,存在模糊或者物体移动,导致得到的结果产生伪影。 为了解决上述问题,这篇文章构造了一个大规模的多曝光率图像数据集,包含不同曝光率的低对比度图像及其对应的高质量ref图像,这个对应的ref图像是通过现有的13中MEF和HDR堆叠等方法生成的效果最好的一种,这样就可以用一张图像作为输入,通过网络学习来达到MEF的目的,作者很巧妙地构造了这样一个数据集,使得单图输入也可以实现多图像输入的结果。 网络的设计也不是特别复杂,作者刚开始直接使用一个15层的网络端到端的学习,发现效果不是很好,然后参考了一些其他论文的方式,图像低频信息代表整体自然度,高频信息代表局部细节,先把图像分为高频和低频部分,对两部分分别进行增强,若直接合并两部分的结果效果不是很好,所以作者把增强后的两部分进行合并后再通过一个网络进一步增强,最终得到对比度增强的结果。训练的时候,先分别训练这两个stage,用第一阶段训练好的参数再来训练第二阶段的网络。两个阶段训练完后,移除第一阶段的两个loss,使用DSSIM作为loss来fine-tune整个网络。
选自arXiv 作者:Alex Lamb, Jonathan Binas, Anirudh Goyal, Dmitriy Serdyuk, Sandeep Subramanian, Ioannis Mitliagkas, Yoshua Bengio 机器之心编译 参与:Panda 在训练数据集上表现优良的深度模型在识别有细微差别的样本时可能会得到非常让人意外的结果。针对这类对抗样本的防御是人工智能安全研究方面重点关注的研究主题之一。近日,蒙特利尔学习算法研究院(MILA)提出了一种有助于提升深度网络在应对对
题目:Training data-efficient image transformers & distillation through attention
在9月23日到9月24日的MDCC 2016年中国移动者开发大会“人工智能与机器人”专场中,阿里云技术专家周昌进行了题为《寻找下一款Prisma APP:深度学习在图像处理中的应用探讨》的演讲。演讲中,他主要介绍深度学习在图像处理领域中的应用,主要内容包括:传统的图像处理:如超分辨、灰度图彩色化、2D/3D转换等;图像/视频风格化;图像生成。
基于深度学习的语义分割方法有一个内在的局限性,即训练模型需要大量具有像素级标注的数据。为了解决这一具有挑战性的问题,许多研究人员将注意力集中在无监督的领域自适应语义分割上。无监督域自适应试图使在源域上训练的模型适应目标域。在本文中,我们介绍了一种自组装技术,这是分类中领域自适应的成功方法之一。然而,将自组装应用于语义分割是非常困难的,因为自组装中使用的经过大量调整的手动数据增强对于减少语义分割中的大的领域差距没有用处。为了克服这一限制,我们提出了一个由两个相互补充的组件组成的新框架。首先,我们提出了一种基于生成对抗性网络(GANs)的数据扩充方法,该方法在计算上高效,有助于领域对齐。给定这些增强图像,我们应用自组装来提高分割网络在目标域上的性能。所提出的方法在无监督领域自适应基准上优于最先进的语义分割方法。
领取专属 10元无门槛券
手把手带您无忧上云