小小挖掘机-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

小小挖掘机

专栏成员

516

文章

918751

阅读量

237

订阅数

推荐系统遇上深度学习(一二七)-[谷歌]用于点击率预估消偏的交叉位置注意力机制

推荐系统深度学习其他

今天给大家分享的是谷歌发表的一篇用于点击率预估中消除位置偏差的论文，除考虑位置本身的影响外，还考虑了相邻位置及展示的item的交叉影响，一起来看一下。

2021-12-27

1.2K0

2021年，还能入坑NLP吗？

NLP 服务机器学习 pytorch 深度学习神经网络

最近有粉丝私信我，NLP很难学，这条路能坚持走吗？有相同困惑的朋友可以一起探讨一下：

2021-11-04

9260

推荐系统遇上深度学习(一二二)-[阿里]通过孪生掩码层来高效的学习特征表示向量

tcp/ip 深度学习推荐系统

今天给大家介绍阿里在CIKM2021上发表的一篇关于Embedding的论文，本文的标题是从阿里妈妈技术复制过来的（共有6篇论文入选，可参考https://zhuanlan.zhihu.com/p/401520358）。论文设计了孪生的自适应掩码层（AMTL）来计算每个特征保留的Embedding长度的大小，在提升精度的同时，还能有效节省Embedding的存储空间并很好的支持模型特征向量的热启动，一起来看一下。

2021-09-17

9930

为什么机器学习算法难以优化？一文详解算法优化内部机制

机器学习神经网络深度学习人工智能

在机器学习中，损失的线性组合无处不在。虽然它们带有一些陷阱，但仍然被广泛用作标准方法。这些线性组合常常让算法难以调整。

2021-05-24

1K0

机器学习最强调参方法！高斯过程与贝叶斯优化

机器学习神经网络深度学习人工智能

机器学习模型中有大量需要事先进行人为设定的参数，比如说神经网络训练的batch-size，XGBoost等集成学习模型的树相关参数，我们将这类不是经过模型训练得到的参数叫做超参数(Hyperparameter)。人为的对超参数调整的过程也就是我们熟知的调参。

2021-03-24

3.7K0

机器学习领域读博这段旅程的一些感悟

机器学习神经网络深度学习人工智能

一位来自Cornell大学的博士给出了他6年博士旅程的一些个人的经验和建议：小步迭代、策略性阅读、主动、专注、坚持、记笔记、重视社区、拓展视野，无论是工程还是研究，都很有用。

2021-01-08

5150

怎样将Embedding融入传统机器学习框架？

机器学习深度学习人工智能神经网络编程算法

LR本身是一个经典的CTR模型，广泛应用于推荐/广告系统。输入的特征大多数是离散型/组合型。那么对于Embedding技术，如何在不使用深度学习模型的情况下（假设就是不能用DNN），融入到LR框架中呢？让我们来看看清华大学的博士石塔西大佬是如何解答的。

2020-12-23

1.8K0

【时空序列】TKDE2020-时空图数据挖掘深度学习技术全面综述

数据挖掘大数据数据分析深度学习机器学习

Deep learning for Spatio-Temporal Data Mining: A Survey

2020-12-08

3.3K0

Batch Normalization的诅咒

批量计算深度学习神经网络机器学习人工智能

Batch Normalization确实是深度学习领域的重大突破之一，也是近年来研究人员讨论的热点之一。Batch Normalization是一种被广泛采用的技术，使训练更加快速和稳定，已成为最有影响力的方法之一。然而，尽管它具有多种功能，但仍有一些地方阻碍了该方法的发展，正如我们将在本文中讨论的那样，这表明做归一化的方法仍有改进的余地。

2020-11-09

8590

深度学习两大基础Tricks：Dropout和BN详解

批量计算深度学习神经网络

dropout作为目前神经网络训练的一项必备技术，自从被Hinton提出以来，几乎是进行深度学习训练时的标配。就像做菜时必须加料酒一样，无论何时，大家在使用全连接层的时候都会习惯性的在后面加上一个dropout层。通常情况下，dropout被作为一种防止神经网络过拟合的正则化方法，对神经网络的泛化性能有很大的帮助。每个人都会用dropout，但你真的理解它吗？本节我们就来看看dropout里的一些关键细节问题。

2020-11-09

5.5K0

重磅盘点：过去8年中深度学习最重要的想法汇总

机器学习人工智能深度学习 pytorch 强化学习

原文：Deep Learning’s Most Important Ideas[1]

2020-11-09

6940

真正想做算法的，不要害怕内卷

编程算法机器学习深度学习神经网络人工智能

也不知道从啥时候开始，内卷这个词就火起来了。具体到数据和算法等技术岗位方面，内卷可以理解为一年比一年高的入行门槛以及愈发激烈的同行竞争。比如说前段时间知乎上的一个“如何看待2021年秋招算法岗灰飞烟灭？”问题，就引发了将近500万人的围观。

2020-11-09

7450

推荐系统遇上深度学习(九十八)-[微信]推荐系统中更好地学习用户-标签偏好

推荐系统大数据深度学习

本文介绍CIKM20上微信发表的一篇文章《Learning to Build User-tag Profile in Recommendation System》，主要介绍了微信看一看（"Top Stories"）中，如何进行用户对标签的兴趣建模，进而提升召回和推荐的效果。

2020-11-06

1.7K0

推荐系统中的排序学习

机器学习深度学习神经网络人工智能编程算法

“ 本文首先介绍排序学习的三种主要类别，然后详细介绍推荐领域最常用的两种高层排序学习算法框架：BPR和LambdaMART。因为排序学习的算法和实践大都来源于信息检索，一些理论也必须从信息检索的领域说起，所以本文也会涉及一些的信息检索、搜索方面的理论知识，但重点依然会放在推荐领域排序学习的应用思路。”

2020-10-09

2.5K0

one-hot encoding不是万能的，这些分类变量编码方法你值得拥有

数据分析机器学习神经网络深度学习人工智能

one-hot encoding 是一种被广泛使用的编码方法，但也会造成维度过高等问题。因此，medium 的一位博主表示，在编码分类变量方面，我们或许还有更好的选择。

2020-10-09

1.3K0

什么样的模型是好的模型？

数据分析机器学习神经网络深度学习人工智能

导读：什么样的模型是好的模型？相信这是每一个数据分析师和大数据AI算法工程师都曾经默默思考过的问题。

2020-10-09

1.6K0

秋招系列 | 推荐岗史上最强面经来袭(上)

编程算法机器学习神经网络深度学习人工智能

背景为985本硕&计算机科班，研究生期间方向主要为推荐算法，投递的方向主要为推荐/广告/机器学习。目前国内已从A收割到Z。本科做工程相关，研究生期间转算法，发表过CCF A类论文一作1篇，有过大厂实习经验、开源项目和机器学习比赛“划水“经历。

2020-09-15

1.3K0

【时间序列】DA-RNN: 基于双阶段注意力机制的循环神经网络

机器学习神经网络深度学习人工智能

论文题目为《基于双阶段注意力机制的循环神经网络》,文章本质上还是基于Seq2Seq的模型，结合了注意力机制实现的时间序列的预测方法，文章的一大亮点是：不仅在解码器的输入阶段引入注意力机制，还在编码器阶段引入注意力机制，编码器的阶段的注意力机制实现了特征选取和把握时序依赖关系的作用。

2020-09-15

1.6K0

KDD 2020 | 多任务保量优化算法在优酷视频场景的实践

机器学习神经网络深度学习人工智能编程算法

导读：今天分享一下阿里优酷视频在KDD 2020上的一篇关于新热视频保量分发上的实践，建立了新热内容曝光敏感模型并给出了一种多目标优化保量的算法，推荐工业界实战干货论文，值得细读。

2020-09-15

2.2K0

不要再对类别变量进行独热编码了

编程算法数据分析机器学习神经网络深度学习

独热编码，也称为dummy变量，是一种将分类变量转换为若干二进制列的方法，其中1表示属于该类别的行。

2020-09-07

2.2K0

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态