小小挖掘机

503 篇文章
367.3K 次阅读
199 人订阅

全部文章

石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(一二二)-[阿里]通过孪生掩码层来高效的学习特征表示向量

今天给大家介绍阿里在CIKM2021上发表的一篇关于Embedding的论文,本文的标题是从阿里妈妈技术复制过来的(共有6篇论文入选,可参考https://zh...

7120
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(一二一)-基于用户行为检索的点击率预估模型

之前咱们介绍过阿里的SIM,通过一种两阶段的方式来使用用户所有行为序列来提升点击率预估的精度。而最近阿里的最新的进展中,尝试将两阶段的处理方式升级为端到端的处理...

10950
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(一一九)-[百度]结合门控机制的多任务学习模型GemNN

今天分享的百度在SIGIR2021上中稿的一篇short paper,论文提出了结合门控机制的多任务学习模型(Gating-Enhanced Multi-Tas...

9410
石晓文

美团点评 · 算法实习生 (已认证)

为什么机器学习算法难以优化?一文详解算法优化内部机制

在机器学习中,损失的线性组合无处不在。虽然它们带有一些陷阱,但仍然被广泛用作标准方法。这些线性组合常常让算法难以调整。

15330
石晓文

美团点评 · 算法实习生 (已认证)

10大算法工程师炼丹Tricks

针对类别不平衡问题,用预测概率对不同类别的loss进行加权。Focal loss对CE loss增加了一个调制系数来降低容易样本的权重值,使得训练过程更加...

21720
石晓文

美团点评 · 算法实习生 (已认证)

如何利用多任务学习提升模型性能?

提升模型性能的方法有很多,除了提出过硬的方法外,通过把神经网络加深加宽(深度学习),增加数据集数目(预训练模型)和增加目标函数(多任务学习)都是能用来提升效果的...

60730
石晓文

美团点评 · 算法实习生 (已认证)

时间间隔感知的自注意力序列化推荐方法

序列化推荐系统通过探索用户的交互顺序,以此基于他们最近所做过的事情的上下文预测他们的下一个动作。之前有马尔可夫链以及循环神经网络RNN和Self Attenti...

21020
石晓文

美团点评 · 算法实习生 (已认证)

机器学习最强调参方法!高斯过程与贝叶斯优化

机器学习模型中有大量需要事先进行人为设定的参数,比如说神经网络训练的batch-size,XGBoost等集成学习模型的树相关参数,我们将这类不是经过模型训练得...

33910
石晓文

美团点评 · 算法实习生 (已认证)

强化学习推荐系统的模型结构与特点总结

提到强化学习,似乎总给人一种难以训练且难以落地的感觉。但是听大佬说,企业里强化学习推荐系统(RLRS)落地的例子其实已经有不少,不过一般都没有公开细节。现有公开...

18120
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(一一一)-双重样本感知的DIFM模型

上一篇中,我们介绍了样本感知的FM模型,也就是IFM模型。而本文将介绍其改进版本,称为Dual Input-aware Factorization Machin...

26820
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(一零六)-神经网络与逻辑推理相结合的NLR框架

今天跟大家分享一篇比较有意思的文章,将逻辑推理的思路应用在推荐系统中,一起来看下吧。

20710
石晓文

美团点评 · 算法实习生 (已认证)

Papers with Code 2020 全年回顾

2020年Papers with Code 中最顶流的论文,代码和benchmark。

32730
石晓文

美团点评 · 算法实习生 (已认证)

机器学习领域读博这段旅程的一些感悟

一位来自Cornell大学的博士给出了他6年博士旅程的一些个人的经验和建议:小步迭代、策略性阅读、主动、专注、坚持、记笔记、重视社区、拓展视野,无论是工程还是研...

18811
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(一零五)-[腾讯]提升推荐多样性的推荐框架FAT

作为2021年的第一篇原创,首先祝大家在新的一年里身体健康,万事顺意。今天给大家介绍的是腾讯发表的一篇论文《Future-Aware Diverse Trend...

41920
石晓文

美团点评 · 算法实习生 (已认证)

怎样将Embedding融入传统机器学习框架?

LR本身是一个经典的CTR模型,广泛应用于推荐/广告系统。输入的特征大多数是离散型/组合型。那么对于Embedding技术,如何在不使用深度学习模型的情况下(假...

38330
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(一零四)-[阿里]CTR预估中细粒度特征学习的多交互注意力网络

今天给大家介绍的是阿里在WSDM21上发表的一篇文章,题目为《Multi-Interactive A ention Network for Fine-grain...

49051
石晓文

美团点评 · 算法实习生 (已认证)

CTR和推荐算法有什么本质区别?

CTR预估起源于计算广告,因为关系到真金白银的定价问题,因此要求预估出来的CTR必须“绝对准确”。这是因为,假如给一个用户准备了A/B/C三个广告,那么无论预测...

56121
石晓文

美团点评 · 算法实习生 (已认证)

大幅提升训练性能,字节提出新型分布式DNN训练架构

现有的分布式 DNN 训练架构无法充分利用异构资源实现高性能训练。近期,来自字节跳动和清华大学的研究人员提出一种新型分布式 DNN 训练架构——BytePS,解...

48230
石晓文

美团点评 · 算法实习生 (已认证)

3W字长文带你轻松入门视觉Transformer

Transformer整个网络结构完全由Attention机制组成,其出色的性能在多个任务上都取得了非常好的效果。本文从Transformer的结构出发,结合视...

28641
石晓文

美团点评 · 算法实习生 (已认证)

比监督学习做的更好:半监督学习

监督学习是人工智能领域的第一种学习类型。从它的概念开始,无数的算法,从简单的逻辑回归到大规模的神经网络,都已经被研究用来提高精确度和预测能力。

23740

扫码关注云+社区

领取腾讯云代金券