首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2139
文章
1932768
阅读量
188
订阅数
【CVPR2023】高保真自由可控的说话头视频生成
来源:专知本文为论文介绍,建议阅读5分钟本文提出一种新的模型,可以产生高保真的头部视频,可以自由控制头部姿态和表情。 说话头生成是根据给定的源身份和目标运动生成视频。然而,目前的方法面临着一些挑战,限制了生成视频的质量和可控性。首先,生成的人脸往往存在意想不到的变形和严重的失真。其次,驾驶图像没有明确地解缠运动相关信息,如姿态和表情,这限制了在生成过程中对不同属性的操作。第三,由于相邻帧之间提取的地标不一致,生成的视频往往存在闪烁伪影。本文提出一种新的模型,可以产生高保真的头部视频,可以自由控制头部姿态和
数据派THU
2023-05-11
2570
【普林斯顿博士论文】深度神经网络在监督学习、生成建模和自适应数据分析中的泛化
📷 来源:专知本文为论文介绍,建议阅读5分钟本文从监督学习开始,最终目的是通过提出新的理论框架和实用工具,阐明深度神经网络在生成式建模和自适应数据分析中的泛化性能。 📷 为什么在小数据集上训练的具有大
数据派THU
2023-04-25
1760
无需强化学习的与人类偏好对齐的语言模型:Wombat袋熊
本文约1200字,建议阅读5分钟本文提出了基于排序的人类偏好对齐方法。 OpenAI 的 ChatGPT 理解多种多样的的人类指令,并且可以很好的应对不同的语言任务需求。自发布以来就掀起了对于通用人工智能的讨论。ChatGPT 令人惊叹的能力来源于一种新颖的大规模语言模型微调方法:RLHF(通过强化学习对齐人类反馈)。 RLHF 方法不同于以往传统的监督学习的微调方式,该方法首先让模型根据指令提示生成不同的回复,之后通过人工的评价反馈,使用强化学习的方式对 LLM 进行微调。RLHF 解锁了语言模型跟从人
数据派THU
2023-04-25
2610
【牛津大学博士论文】机器学习中的组合性和函数不变量
来源:专知本文为论文介绍,建议阅读5分钟本文探索了机器学习许多子领域的范畴理论表述,包括优化、概率、无监督学习和有监督学习。 本文的目的是表明,研究机器学习系统中潜在的组成和函数结构使我们能够更好地理解它们。本文探索了机器学习许多子领域的范畴理论表述,包括优化、概率、无监督学习和有监督学习。本文首先研究了当用一般的范畴理论结构取代梯度时,各种优化算法的行为。证明了这些算法的关键性质在非常宽松的假设下是成立的,并通过数值实验证明了这一结果。本文还探索了动态系统的范畴论视角,使我们能够从简单操作的组成中构建强
数据派THU
2023-03-29
2940
西电NeurIPS 2022 | 基于结构聚类的异质图自监督学习
来源:北邮 GAMMA Lab 本文约1200字,建议阅读5分钟 本文提出一个基于结构聚类的异质图自监督学习方法SHGP,它无需任何正样本或者负样本。 论文作者:杨亚明,管子玉,王哲,赵伟,徐偲,陆维港,黄健斌 论文单位:西安电子科技大学,计算机科学与技术学院 1. 引言 现阶段,图(Graph)上的自监督学习大多都遵循图对比学习框架,这些方法通常需要先构造一系列的正样本对以及负样本对,然后通过在低维表示空间中拉近正样本并且推远负样本来学习节点/图的表示。目前,研究者们已经探索了节点丢弃、连边扰动等各
数据派THU
2023-03-29
2780
【AAAI2023】基于时空自监督学习的交通流预测
来源:专知本文为论文介绍,建议阅读5分钟本文提出了一种新的时空自监督学习(ST-SSL)流量预测框架。 城市不同时段交通流量的鲁棒预测在智能交通系统中起着至关重要的作用。尽管已有工作在建模时空相关性方面做了大量工作,但现有方法仍然存在两个关键局限性:i)大多数模型都是集体预测所有区域的流量,没有考虑空间异质性,即不同区域可能存在交通流分布的倾斜。ii) 这些模型无法捕捉由时变交通模式引起的时间异质性,因为它们通常对所有时间段的共享参数空间的时间相关性进行建模。为了应对这些挑战,本文提出了一种新的时空自监督
数据派THU
2023-03-29
4450
人工智能300年!LSTM之父最新长文:详解现代AI和深度学习发展史(附下载)
来源:新智元 Abner说AI本文约8900字,建议阅读15+分钟本文包括神经网络、深度学习、人工智能等领域的重要事件,以及那些为AI奠定基础的科学家们。 关注微信公众号“数据派THU”,后台回复“20230214”,即可领取参考资料高清PDF文件! 参考资料: https://people.idsia.ch/~juergen/deep-learning-history.html [ 导读 ] 最近,LSTM之父Jürgen Schmidhuber梳理了17世纪以来人工智能的历史。在这篇万字长文中,S
数据派THU
2023-02-27
4010
原创 | 一文读懂K均值(K-Means)聚类算法
众所周知,机器学习算法可分为监督学习(Supervised learning)和无监督学习(Unsupervised learning)。
数据派THU
2022-12-16
2.1K0
深度学习和经典统计学是一回事?
来源:机器之心 本文约7000字,建议阅读10+分钟 本文会解释为什么深度学习的基础其实不同于统计学,甚至不同于经典的机器学习。 深度学习和简单的统计学是一回事吗?很多人可能都有这个疑问,毕竟二者连术语都有很多相似的地方。在这篇文章中,理论计算机科学家、哈佛大学知名教授 Boaz Barak 详细比较了深度学习与经典统计学的差异,认为“如果纯粹从统计学角度认识深度学习,就会忽略其成功的关键因素”。 图源:https://twitter.com/YiMaTweets/status/155391346418
数据派THU
2022-10-11
5750
WWW 2022 | 可扩展的图随机神经网络
本文约900字,建议阅读5分钟本文提出了一个用于半监督学习的可扩展高性能 GNN 框架。 论文标题:GRAND+: Scalable Graph Random Neural Networks 收录来源:WWW 2022 论文来源:https://arxiv.org/pdf/2203.06389.pdf 论文介绍 近期的工作认为图随机神经网络具有很好的性能,但是难以用在大型图上。本文提出了一个广义的前推算法,预先计算传播矩阵,并使用它以小批量方式执行图数据扩充,最后使用一个自信感知的一致性损失来优化模型。
数据派THU
2022-09-23
2940
论文推荐:使用带掩码的孪生网络进行自监督学习
来源:Deephub Imba 本文约1100字,建议阅读9分钟 本文介绍了使用带掩码的网络如何进行自监督学习。 最近自我监督学习被重视起来。昨天我通过LinkedIn发现了这项工作,我觉得它很有趣。kaiming大神的MAE为ViT和自监督的预训练创造了一个新的方向,本篇文章将介绍Masked Siamese Networks (MSN),这是另一种用于学习图像表示的自监督学习框架。MSN 将包含随机掩码的图像视图的表示与原始未遮蔽的图像的表示进行匹配。 考虑一个大的未标记图像集D = (x_i)和一个
数据派THU
2022-09-19
5820
【MIT博士论文】利用临床和生物医学表征学习的结构和知识
来源:专知本文为论文介绍,建议阅读5分钟在本文中,我将探索新的生物医学数据预训练和表示学习策略,这些策略利用外部结构或知识来为局部和全局尺度的学习提供信息。 用于健康和生物医学领域的机器学习的数据集通常是有噪声的,采样不规律,只有稀疏的标记,相对于数据和任务的维度都很小。这些问题推动了表示学习在这个领域的应用,它包含了各种技术,旨在产生适合下游建模任务的数据集表示。该领域的表示学习还可以利用生物医学领域的重要外部知识。在本文中,我将探索新的生物医学数据预训练和表示学习策略,这些策略利用外部结构或知识来为局
数据派THU
2022-09-14
3220
自学成才的人工智能显示出与大脑工作方式的相似之处
来源: ScienceAI本文约3800字,建议阅读5分钟本文介绍了自学成才的人工智能显示出与大脑工作的相似之处。 十年来,许多最令人印象深刻的人工智能系统都是使用大量标记数据进行教学的。例如,可以将图像标记为「虎斑猫」或「虎猫」,以「训练」人工神经网络以正确区分虎斑和虎。该战略既取得了惊人的成功,又严重不足。 这种「监督」训练需要人工费力地标记数据,而神经网络通常会走捷径,学习将标签与最少、有时甚至是肤浅的信息联系起来。例如,神经网络可能会使用草的存在来识别牛的照片,因为牛通常是在田野中拍摄的。 「我们
数据派THU
2022-09-07
2370
【MIT博士论文】自监督学习语音处理
来源:专知本文约3000字,建议阅读5分钟在这篇论文中,我们探索使用自我监督学习。 在大量标记语音数据上使用监督学习算法训练的深度神经网络在各种语音处理应用中取得了显著的性能,往往在相应的排行榜上处于领先地位。然而,训练这些系统依赖于大量带注释的语音这一事实,为继续发展最先进的性能造成了可扩展性瓶颈,而且对在语音领域部署深度神经网络构成了更根本的障碍,因为标记数据本质上是罕见的,昂贵的,或耗时的收集。 与带注释的语音相比,未转录的音频通常积累起来要便宜得多。在这篇论文中,我们探索使用自我监督学习——一种学
数据派THU
2022-09-07
4360
更简单的掩码图像建模框架SimMIM介绍和PyTorch代码实现
来源:DeepHub IMBA本文约4000字,建议阅读10+分钟本文中我们介绍了 SimMIM,这是一种受掩码建模启发的强大 SSL 算法,其中一部分输入数据被掩码,模型的目标是最小化重建损失。 MAE发布以来,各种使用掩码技术的自监督掩码模型在其基础之上有了更进一步的研究。在本文中我们将探索一篇和MAE同期的工作:SimMIM: A Simple Framework for Masked Image Modeling,研究团队是微软亚研院,并在PyTorch中编写它,最后我们也会提供相关的代码。 Sim
数据派THU
2022-08-29
5600
理论计算机科学家 Boaz Barak:深度学习并非“简单的统计”,二者距离已越来越远
来源:AI科技评论本文约7600字,建议阅读15分钟本文介绍了深度学习或机器学习中的概念归纳为统计学中的词义,也引起了大多数人对深度学习本质的认知偏差:即深度学习是“简单的统计”。 上世纪九十年代,斯坦福大学的知名生物信息学教授 Rob Tibshirani 曾拟了一个词汇表,将机器学习与统计学中的不同概念作了简单而粗暴的对应关系: 一方面,这个表格为理解机器学习提供了基础的认识,但同时,其简单地将深度学习或机器学习中的概念归纳为统计学中的词义,也引起了大多数人对深度学习本质的认知偏差:即深度学习是“简
数据派THU
2022-08-29
2510
综述 | 深度学习的最新进展
来源:机器学习研习院本文约10500字,建议阅读20+分钟本文我们将简要讨论近年来关于深度学习的最新进展。 “ 综述永远是入门新领域的最快捷径之一!” Recent Advances in Deep Learning:An Overview 摘要:深度学习是机器学习和人工智能研究的最新趋势之一。它也是当今最流行的科学研究趋势之一。深度学习方法为计算机视觉和机器学习带来了革命性的进步。新的深度学习技术正在不断诞生,超越最先进的机器学习甚至是现有的深度学习技术。近年来,全世界在这一领域取得了许多重大突破。由于
数据派THU
2022-07-07
6190
Multimix:从医学图像中进行的少量监督,可解释的多任务学习
来源:DeepHub IMBA本文约4000字,建议阅读10+分钟本文与你讨论一种新的半监督,多任务医学成像方法。 在本文中,我将讨论一种新的半监督,多任务医学成像方法,称为Multimix,Ayana Haque(ME),Abdullah-Al-Zubaer Imran,Adam Wang、Demetri Terzopoulos。该论文被ISBI 2021收录,并于4月的会议上发表。 MultiMix通过采用基于置信的增强策略和新型桥模块来执行联合半监督分类和分割,该模块还为多任务提供了可解释性。在完全监
数据派THU
2022-07-01
6390
视觉弱监督学习研究进展
来源:专知本文约1680字,建议阅读6分钟如何结合深度学习和视觉数据任务特点发展视觉弱监督学习模型方法,成为近年来计算机视觉领域的一个研究热点。 视觉理解,如物体检测、语义和实例分割以及动作识别等,在人机交互和自动驾驶等领域中有着广泛的应用并发挥着至关重要的作用。近年来,基于全监督学习的深度视觉理解网络取得了显著的性能提升。然而,物体检测、语义和实例分割以及视频动作识别等任务的数据标注往往需要耗费大量的人力和时间成本,已成为限制其广泛应用的一个关键因素。弱监督学习作为一种降低数据标注成本的有效方式,有望对
数据派THU
2022-07-01
3550
WWW 2022 | 无监督图结构学习
来源:PaperWeekly本文约4500字,建议阅读10+分钟本文率先提出了无监督图结构学习的范式,旨在不依赖标签信息的条件下,从数据本身中学习更普适、更高质量的图结构。 ©作者 | Yuki 研究方向 | 推荐系统,图神经网络 论文题目: Towards Unsupervised Deep Graph Structure Learning 论文链接: https://arxiv.org/pdf/2201.06367.pdf 代码链接: https://github.com/GRAND-Lab/SUBL
数据派THU
2022-06-29
6370
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档