首页
学习
活动
专区
工具
TVP
发布

炼丹笔记

专栏作者
255
文章
237595
阅读量
37
订阅数
突破双塔: 生成式交互向量化召回
TLDR: 本文介绍了一种突破传统的双塔式(two-tower)模型的新方法,这种方法利用一个轻量级的生成模型提取一侧(例如文档侧)的特征,并模拟生成另一侧(例如查询侧)的特征。这种模型的优点在于,它实现在底层进行特征交叉,而不仅仅是在顶层进行内积。效果显著,同时Serving效率与纯双塔模型持平。此研究相当于进一步扩展了双塔式模型中引入交叉特征的可能性,并展望了在召回侧引入交叉特征的新做法。
炼丹笔记
2023-12-11
5280
领域大模型落地的一些思考
自训练模型开始,就一直再跟Leader Battle这个问题,领域大模型需不需要有通用化能力。就好比华为盘古大模型“只做事不作诗”的slogan,是不是训练的领域大模型可以解决固定的几个任务就可以了。
炼丹笔记
2023-08-22
2840
马斯克血洗推特!传机器学习裁员90%,团队直接解散
据称已经有3700多名员工卷铺盖走人了。按照推特7500人左右的员工数量来看,看起来猜50%的人赌对了。
炼丹笔记
2023-01-30
5080
Meta暴裁1.1万人:3年烧光2000多亿元,小扎承认犯了错,但仍会继续注资元宇宙
两年前,疫情刚开始之际,包括 Zoom、谷歌、亚马逊、Facebook 在内的科技巨头们乘着疫情这股“东风”,营收达到了两位数增长。他们获得了丰厚的利润,于是开始招兵买马,迅速扩张。
炼丹笔记
2023-01-30
3050
端上重排系统:提升推荐系统的实时性
获奖论文《Real-time Short Video Recommendation on Mobile Devices》针对短视频推荐场景,传统服务端部署的推荐系统在决策时机和实时特征利用方面的不足问题,通过在移动客户端部署推荐系统来实时响应用户反馈,提高推荐结果的精准度,从而提升用户体验。论文提出的方案 100% 流量部署到了快手短视频推荐生产环境,影响了日均超过 3.4 亿用户的体验,是端上智能在大规模推荐场景落地的创新实践。
炼丹笔记
2023-01-03
1.4K0
冠军方案 | 天池心电异常事件预测
心电图是医院心脏疾病常用辅助诊断指标。心电图由于其价格低、无创的特性被广泛用于心脏疾病的预筛查以及体检中,每天的检测量巨大。目前,多导联的心电图设备已经广泛用于临床当中,部分设备已经具有自动分析诊断功能,但自动分析对于多心电异常事件的判别还不够精确,需要医生做进一步修改。
炼丹笔记
2023-01-03
4510
推荐系统多任务学习上分技巧
本文是一篇多任务学习的文章, 里面的设计思路非常值得借鉴,也较为符合我们的直观理解,实践中也确实带来了不错的效果。
炼丹笔记
2023-01-03
4670
开箱即用实现多GPU推理:基于Tensorflow、Keras实现Stable Diffusion
最近一段时间,文本转图像模型 Stable Diffusion 可谓是爆红 AI 圈,其是由慕尼黑大学和 Runway 的研究者基于 CVPR 2022 的论文《High-Resolution Image Synthesis with Latent Diffusion Models》实现的,它可以在消费级 GPU 上运行。
炼丹笔记
2023-01-03
1.3K0
微信大数据挑战赛:第1周周星星方案汇总
多模态短视频分类是视频理解领域的基础技术之一,在安全审核、推荐运营、内容搜索等领域有着十分非常广泛的应用。一条短视频中通常包含有三种模态信息,即文本、音频、视频, 它们在不同语义层面的分类体系中发挥着相互促进和补充的重要作用。
炼丹笔记
2022-10-27
5930
Prompt:Fine-tune之后的新范式
全监督学习,即仅在目标任务的输入输出样本数据集上训练特定任务模型,长期以来在许多机器学习任务中发挥着核心作用,同样的,全监督学习在 NLP 领域也非常重要。但是全监督的数据集对于学习高质量的模型来说是不充足的,早期的 NLP 模型严重依赖特征工程。随着用于 NLP 任务的神经网络出现,使得特征学习与模型训练相结合,研究者将研究重点转向了架构工程,即通过设计一个网络架构能够学习数据特征。
炼丹笔记
2022-10-27
6850
有趣的知识点:深度学习和互联网行业「黑话」指南
↑↑↑关注后"星标"炼丹笔记 炼丹笔记 知识点 来源:Coggle数据科学 技术 黑话 📷 hypothesis:我猜的,先做一个假设 intuition:我猜的,而且别人也认同 rebuttal:撕逼 Ablation study:控制变量法 baseline:(故意)选的方法,比我的差 benchmark:我会的数据集 End-to-end:拉通对齐,组合拳 interpretability:稍微画一下图 fine tune:再训练一下 feature map:中间计算结果 Ground t
炼丹笔记
2022-10-27
3230
阿里天池算法大赛:中医药领域的问题生成冠军方案
UniLM也是一个多层Transformer网络,跟bert类似,但是UniLM能够同时完成三种预训练目标,如上述表格所示,几乎囊括了上述模型的几种预训练方式,而且新增了sequence-to-sequence训练方式,所以其在NLU和NLG任务上都有很好的表现。UniLM模型基于mask词的语境来完成对mask词的预测,也是完形填空任务。对于不同的训练目标,其语境是不同的。
炼丹笔记
2022-10-27
3530
降低数据大小的四大绝招。
在非常多的问题中,例如商品推荐数据存储(大量的用户和商品,还有购买金额等信息),金融数据存储(大量的标的,价格等),我们不可避免的都会碰到数据过大的问题,如果对这类数据进行处理显得直观重要,本文我们介绍碰到大数据时,我们采用的四种策略。
炼丹笔记
2022-10-27
1.2K0
优化PyTorch速度和内存效率的技巧汇总
深度学习模型的训练/推理过程涉及很多步骤。在有限的时间和资源条件下,每个迭代的速度越快,整个模型的预测性能就越快。我收集了几个PyTorch技巧,以最大化内存使用效率和最小化运行时间。为了更好地利用这些技巧,我们还需要理解它们如何以及为什么有效。
炼丹笔记
2022-10-27
1.9K0
年龄不是上限!我只是按照自己的兴趣专注于机器学习
我只是按照自己的兴趣,尽可能多地专注于学习机器学习。年龄只是一个数字,何时开始以及可以实现多少没有上限。 Philip是Kaggle Competitions Grandmaster,他以17枚金牌名列第 47 位。
炼丹笔记
2022-10-27
2610
ICLR 2022:软标签情况下如何设计主动学习策略?
ICLR (International Conference on Learning Representation) 国际表征学习大会是公认的深度学习领域国际顶级会议之一,关注有关深度学习各个方面的前沿研究,在人工智能、统计和数据科学领域以及机器视觉、语音识别、文本理解等重要应用领域中发布了众多极其有影响力的论文。
炼丹笔记
2022-10-27
4060
重新审视半监督学习的伪标签
Curriculum Labeling (CL),在每个自训练周期之前重新启动模型参数,优于伪标签 (PL)。
炼丹笔记
2022-10-27
3390
暴力特征工程汇总
特征工程的问题往往需要具体问题具体分析,当然也有一些暴力的策略,可以在竞赛初赛前期可以带来较大提升,而很多竞赛往往依赖这些信息就可以拿到非常好的效果,剩余的则需要结合业务逻辑以及很多其他的技巧,此处我们将平时用得最多的聚合操作罗列在下方。
炼丹笔记
2022-10-27
8720
XGBoost如何用2GB内存训练100GB的数据!
在大规模数据集进行读取进行训练的过程中,迭代读取数据集是一个非常合适的选择,在Pytorch中支持迭代读取的方式。接下来我们将介绍XGBoost的迭代读取的方式。
炼丹笔记
2022-10-27
8890
ACL 2022:融合标签语义的双塔BERT模型
这是一篇来自于 ACL 2022 的文章,总体思想就是在 meta-learning 的基础上,采用双塔 BERT 模型分别来对文本字符和对应的label进行编码,并且将二者进行 Dot Product(点乘)得到的输出做一个分类的事情。文章总体也不复杂,涉及到的公式也很少,比较容易理解作者的思路。对于采用序列标注的方式做 NER 是个不错的思路。
炼丹笔记
2022-10-27
7140
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档