首页
学习
活动
专区
工具
TVP
发布

数据派THU

专栏作者
2138
文章
1923017
阅读量
188
订阅数
​图表示学习技术在药物推荐系统中的应用
本文约6500字,建议阅读13分钟 本次分享的题目是图表示学习技术在药物推荐系统中的应用。 主要包括以下四个部分: 研究背景与挑战 判别式药品包推荐  生成式药品包推荐 总结与展望 01、研究背景与挑战 1. 研究背景 医疗资源总体不足,分布不均带来沉重压力 药物推荐是智慧医疗的一个子问题,首先从智慧医疗的大背景说起,在我国智慧医疗存在紧迫性,随着人口增长、老龄化加剧,人们对于高质量医疗服务的需求不断攀升。图中两组数据,一是全国医疗机构的就诊人数在 60.5 亿人次,同比增长 22.4%;二是柳叶刀上关于
数据派THU
2023-02-27
9020
原创 | Attention is all you need 论文解析(附代码)
作者:杨金珊审校:陈之炎 本文约4300字,建议阅读8分钟“Attention is all you need”一文在注意力机制的使用方面取得了很大的进步,对Transformer模型做出了重大改进。
数据派THU
2022-12-16
8290
图数据库和知识图谱在微财风控系统中的探索和应用
来源:AI前线 本文约3500字,建议阅读7分钟 本文为你介绍图数据库作为复杂关系网络分析的一个强有力的工具在微财风控系统中的探索和应用。 近年来随着监管力度的不断提升,金融机构业务的不断发展,交易方式越发便利的背景下。客户、账务、资金等关系也越发复杂,黑产也更加隐蔽,对内部风控要求也在不断加强。传统的关系型数据库在这种复杂的关系网络上发挥的效果越发有限,在多维度的查询上很难在合理的时间内返回结果。图数据库作为复杂关系网络分析的一个强有力的工具,如何高效的发挥其在高性能、高扩展、高稳定性方面的能力,显得至
数据派THU
2022-10-09
5010
【NeurIPS2022】SparCL:边缘稀疏持续学习
来源:专知本文为论文介绍,建议阅读5分钟在这项工作中,我们提出了一个名为稀疏持续学习(SparCL)的新框架,这是第一个利用稀疏性在边缘设备上实现低成本持续学习的研究。 现有的持续学习(CL)研究集中在减轻灾难性遗忘上,即模拟在学习新任务时对过去任务的表现恶化。然而,对于CL系统的训练效率研究不足,这限制了CL系统在资源有限场景下的实际应用。在这项工作中,我们提出了一个名为稀疏持续学习(SparCL)的新框架,这是第一个利用稀疏性在边缘设备上实现低成本持续学习的研究。SparCL通过权值稀疏性、数据效率和
数据派THU
2022-09-27
2140
论文推荐:使用带掩码的孪生网络进行自监督学习
来源:Deephub Imba 本文约1100字,建议阅读9分钟 本文介绍了使用带掩码的网络如何进行自监督学习。 最近自我监督学习被重视起来。昨天我通过LinkedIn发现了这项工作,我觉得它很有趣。kaiming大神的MAE为ViT和自监督的预训练创造了一个新的方向,本篇文章将介绍Masked Siamese Networks (MSN),这是另一种用于学习图像表示的自监督学习框架。MSN 将包含随机掩码的图像视图的表示与原始未遮蔽的图像的表示进行匹配。 考虑一个大的未标记图像集D = (x_i)和一个
数据派THU
2022-09-19
5770
【MIT博士论文】自监督学习语音处理
来源:专知本文约3000字,建议阅读5分钟在这篇论文中,我们探索使用自我监督学习。 在大量标记语音数据上使用监督学习算法训练的深度神经网络在各种语音处理应用中取得了显著的性能,往往在相应的排行榜上处于领先地位。然而,训练这些系统依赖于大量带注释的语音这一事实,为继续发展最先进的性能造成了可扩展性瓶颈,而且对在语音领域部署深度神经网络构成了更根本的障碍,因为标记数据本质上是罕见的,昂贵的,或耗时的收集。 与带注释的语音相比,未转录的音频通常积累起来要便宜得多。在这篇论文中,我们探索使用自我监督学习——一种学
数据派THU
2022-09-07
4320
更简单的掩码图像建模框架SimMIM介绍和PyTorch代码实现
来源:DeepHub IMBA本文约4000字,建议阅读10+分钟本文中我们介绍了 SimMIM,这是一种受掩码建模启发的强大 SSL 算法,其中一部分输入数据被掩码,模型的目标是最小化重建损失。 MAE发布以来,各种使用掩码技术的自监督掩码模型在其基础之上有了更进一步的研究。在本文中我们将探索一篇和MAE同期的工作:SimMIM: A Simple Framework for Masked Image Modeling,研究团队是微软亚研院,并在PyTorch中编写它,最后我们也会提供相关的代码。 Sim
数据派THU
2022-08-29
5520
SIGIR 2022|邻域建模Graph-Masked Transformer提高微信视频点击率预测
来源:机器之心本文约3000字,建议阅读5分钟本文介绍了由腾讯 AI Lab 和微信公众平台共同研发的一种最新的在异质图上基于邻域交互的点击预测新模型。 本文介绍的是腾讯 AI Lab 和微信公众平台共同研发的一种最新的在异质图上基于邻域交互的点击预测新模型。论文题目为《Neighbour Interaction based Click-Through Rate Prediction via Graph-masked Transformer》,论文已被 SIGIR2022 录用。并且在实际线上场景部署 A/
数据派THU
2022-08-29
1880
图神经网络的可解释性方法介绍和GNNExplainer解释预测的代码示例(附代码)
来源:DeepHub IMBA本文约3800字,建议阅读7分钟本文使用pytorch-geometric实现的GNNExplainer作为示例。 深度学习模型的可解释性为其预测提供了人类可以理解的推理。如果不解释预测背后的原因,深度学习算法就像黑匣子,对于一些场景说是无法被信任的。不提供预测的原因也会阻止深度学习算法在涉及跨域公平、隐私和安全的关键应用程序中使用。 深度学习模型的可解释性有助于增加对模型预测的信任, 提高模型对与公平、隐私和其他安全挑战相关的关键决策应用程序的透明度,并且可以让我们了解网络特
数据派THU
2022-08-29
6050
李飞飞团队将ViT用在机器人身上,规划推理最高提速512倍,还cue了何恺明的MAE
来源:量子位(公众号id:qbitai)本文约1100字,建议阅读5分钟本文为你介绍李飞飞团队的最新研究。 人类的预测能力+ViT,会产生什么样的化学反应? 会让机器人的行动规划能力又快又准。 这是李飞飞团队的最新研究——MaskViT,通过MVM,掩码视觉建模对Transformer进行预训练,从而建立视频预测模型。 结果显示,MaskViT不仅能生成256*256视频,还可以让机器人行动规划的推理速度最高提高了512倍。 来看看这是项什么样的研究? 从人类身上找灵感 神经科学领域的研究表明,
数据派THU
2022-07-04
2640
文本生成图像这么火,你需要了解这些技术的演变
来源:机器之心本文约8220字,建议阅读10+分钟本文梳理了较为优秀的多模态文本图像模型。 目前多模态任务成为行业热点,本文梳理了较为优秀的多模态文本图像模型:DALL·E、CLIP、GLIDE、DALL·E 2 (unCLIP)的模型框架、优缺点,及其迭代关系。 OpenAI 最近发布了 DALL·E 2 系统,在 AI 界引发了「地震」,该系统能够根据文本描述创建图像。这是 DALL·E 系统的第二个版本,第一个版本是在近一年前发布的。然而,在 OpenAI 内部,DALL·E 2 背后的模型被称为
数据派THU
2022-06-20
7980
叫板DALL·E 2,预训练大模型做编码器,谷歌把文字转图像模型卷上天
来源:机器之心本文约3400字,建议阅读8分钟本文介绍了来自谷歌的研究者也在OpenAI做出了探索,提出了一种文本到图像的扩散模型 Imagen。 OpenAI:DALL・E 2 就是最好的。谷歌:看下我们 Imagen 生成的柴犬? 多模态学习近来受到重视,特别是文本 - 图像合成和图像 - 文本对比学习两个方向。一些模型因在创意图像生成、编辑方面的应用引起了公众的广泛关注,例如 OpenAI 的文本转图像模型 DALL・E、英伟达的 GauGAN。现在,来自谷歌的研究者也在这一方向做出了探索,提出了一种
数据派THU
2022-06-07
6090
谷歌夺回AI画语权,机器的想象力达到全新高度,网友:DALL·E 2诞生一个月就过时了?
本文经AI新媒体量子位(公众号 ID: QbitAI)授权转载,转载请联系出处本文约2000字,建议阅读5分钟本文介绍了谷歌派出名为Imagen的选手在DALL·E 2上打擂台的进展。 在让AI搞创作这件事上,谷歌和OpenAI正面刚起来了。 这不,震惊全网的DALL·E 2才新鲜出炉一个月,谷歌就派出名为Imagen的选手来打擂台。 直接上图对比,左边是谷歌Imagen选手眼中的“猫猫绊倒人类雕像”,右边则是DALL·E 2选手的同题创作。 你觉得哪一位选手的作品更符合题意? 而让网友们直呼“DALL
数据派THU
2022-06-07
5070
独家 | 这张骑马的宇航员图片是AI感知世界的一个里程碑(附链接)
文:Will Douglas Heaven April 6, 2022(2022 年4月6日)翻译:陈超校对:zrx 本文约3400字,建议阅读10分钟本文介绍了DALL-E的升级版,DALL-E 2对于人工智能的意义。 DALL-E 2021年初OpenAI的制图神经网络DALL-E一经发布,该项目便以新方法整合不同概念的类人化能力得到瞩目。DALL-E根据需求制作的图片是超现实且卡通化的,他们展现出了AI已经学会了世界是如何融合在一起的关键课程。DALL-E的鳄梨手扶椅具有鳄梨和椅子的关键特征;穿着t
数据派THU
2022-04-27
1.5K0
《自然·通讯》基于机器学习的观测约束预测野火带来的全球社会经济风险将继续升高
来源:专知本文约500字,建议阅读5分钟研究人员预测在本世纪未来几十年内,全球野火的燃烧面积和碳排放都有增加趋势。 https://www.nature.com/articles/s41467-022-28853-0 近日,北京大学物理学院大气与海洋科学系俞妍研究员与美国能源部橡树岭国家实验室毛嘉富研究员等合作,发展利用机器学习和13个CMIP6地球系统模式挖掘未来野火分布和当前野火及其驱动因子之间的定量联系,将基于多源观测资料的当前野火及其驱动因子带入上述当前-未来联系中,从而预测未来的野火分布。这一研
数据派THU
2022-04-14
3390
字节最新文本生成图像AI,训练集里居然没有一张带文字描述的图片?!
来源:本文经AI新媒体量子位(公众号 ID: QbitAI)授权转载,转载请联系出处本文约1300字,建议阅读9分钟本文介绍了字节的最新text2image模型,实现了文本-图像都不使用,也可以让AI学会看文作图。 一个文本-图像对数据都不用,也能让AI学会看文作图? 来自字节的最新text2image模型,就做到了。 实验数据显示,它的效果比VQGAN-CLIP要真实,尤其是泛化能力还比不少用大量文本-图像数据对训练出来的模型要好很多。 嗯?不给文字注释AI怎么知道每一张图片代表什么? 这个模型到底咋训
数据派THU
2022-04-08
1.1K0
【CVPR2022】UniVIP:自监督视觉预训练的统一框架
来源:专知本文为论文,建议阅读5分钟我们提出了统一自监督视觉预训练(UniVIP) 论文标题:UniVIP: A Unified Framework for Self-Supervised Visual Pre-training 论文链接:https://arxiv.org/abs/2203.06965 作者单位:中国科学院自动化研究所 & 商汤科技 & 南洋理工大学 自监督学习 (SSL) 有望利用大量未标记的数据。然而,流行的 SSL 方法的成功仅限于像 ImageNet 中的单中心对象图像,并且忽
数据派THU
2022-03-21
4680
自回归解码加速64倍,谷歌提出图像合成新模型MaskGIT
来源:机器之心本文约2200字,建议阅读5分钟一种使用双向 transformer 解码器的新型图像合成模型 MaskGIT,在性能和速度上都获得了大幅改进。 来自谷歌研究院的研究者提出了一种使用双向 transformer 解码器的新型图像合成模型 MaskGIT,在性能和速度上都获得了大幅改进。‍ 生成式 transformer 在合成高保真和高分辨率图像方面得到了快速普及。但迄今为止最好的生成式 transformer 模型仍是将图像视为一系列 token,并按照光栅扫描顺序(即逐行)解码图像。然而这
数据派THU
2022-03-18
3680
深入了解 TabNet :架构详解和分类代码实现
来源:Deephub Imba本文约3500字,建议阅读5分钟本文我们将深入研究称为 TabNet (Arik & Pfister (2019)) 的神经网络架构,该架构旨在可解释并与表格数据很好地配合使用。 Google发布的TabNet是一种针对于表格数据的神经网络,它通过类似于加性模型的顺序注意力机制(sequential attention mechanism)实现了instance-wise的特征选择,还通过encoder-decoder框架实现了自监督学习。 表格数据是日常中用到的最多的数据类型
数据派THU
2022-03-04
1.3K0
自回归模型PixelCNN 的盲点限制以及如何修复
来源: DeepHub IMBA本文约4500字,建议阅读10分钟本篇文章我们将关注 PixelCNNs 的最大限制之一(即盲点)以及如何改进以修复它。 在这篇文章中我们将介绍盲点的概念,讨论 PixelCNN 是如何受到影响的,并实现一种解决方案——Gated PixelCNN。 盲点 PixelCNN 学习图像中所有像素的条件分布并使用此信息进行预测。PixelCNN 将学习像素从左到右和从上到下的分布,通常使用掩码来确保“未来”像素(即正在预测的像素右侧或下方的像素)不能用于给定像素的预测。如下图A所
数据派THU
2022-03-04
3820
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档