腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

null的专栏

专栏作者

398

文章

570025

阅读量

69

订阅数

多目标建模算法PLE

在现如今的推荐系统或者搜索中，都存在多个目标，多目标的算法在现如今的系统中已然成为了标配。在多目标的建模过程中，如果不同的学习任务之间较为相关时，多个任务之间可以共享一部分的信息，这样最终能够提升整体的模型学习效果。但是如果多个任务之间的相关性并不强，或者说多个任务之间存在某种冲突，这样通过部分的共享就会起到事与愿违的效果，这便是通常所说的在多任务建模中出现的负迁移（negative transfer）现象，即在相关性不强或者无相关性的多任务环境下进行信息共享，最终影响整体的网络效果，MMo[1]便是在这样的情况下被提出。在MMoE中，通过共享多个专家（expert）实现信息的共享，同时针对每一个上层任务（task）都有对应的门控函数（gate），学习到多个专家对于特定任务的贡献程度，即专家的分布。以此，实现了对任务之间的关联和区别的学习。

2023-01-18

7810

注意力FM模型AFM

在CTR预估任务中，对模型特征的探索是一个重要的分支方向，尤其是特征的交叉，从早起的线性模型Logistic Regression开始，研究者在其中加入了人工的交叉特征，对最终的预估效果起到了正向的效果，但是人工的方式毕竟需要大量的人力，能否自动挖掘出特征的交叉成了研究的重要方向，随着Factorization Machines[1]的提出，模型能够自动处理二阶的特征交叉，极大减轻了人工交叉的工作量。

2023-01-16

5940

深度网络CTR建模

CTR预估是现如今的搜索、推荐以及广告中必不可少的一部分，CTR预估的目标是预估用户点击给定item的概率。经过这么多年的发展，CTR预估算法得到了较大的改进，从开始的线性模型LR，发展到带有特征交叉的FM算法，随着深度网络的发展，CTR预估也逐渐发展到如今的基于深度模型的CTR预估，期间出现了较大一批成功在业界得到广泛应用的算法模型，如Wide & Deep，DeepFM，DIN，DIEN等等。

2022-12-31

7350

人脸检测和对齐算法MTCNN

神经网络机器学习深度学习人工智能人脸识别

人脸识别在实际的生活中有着广泛的应用，得益于深度学习的发展，使得人脸识别的准确率得到大幅度提升。然而，为了做好人脸识别，第一步需要做的是对人脸检测，主要是通过对图片分析，定位出图片中的人脸。近年来，深度学习在人脸检测方面也得到了大力发展，在2016年Kaipeng Zhang, Zhanpeng Zhang等人提出了人脸检测算法MTCNN（Multi-task Cascaded Convolutional Networks）模型[1]，MTCNN算法的效果也是得到了很多实际项目的验证，在工业界得到了广泛的应用，在我个人的实际项目中也得到了较多应用。在MTCNN算法中，主要有三点的创新：

2022-12-31

1.7K0

深度网络CTR建模

深度学习 jquery

CTR预估是现如今的搜索、推荐以及广告中必不可少的一部分，CTR预估的目标是预估用户点击给定item的概率。经过这么多年的发展，CTR预估算法得到了较大的改进，从开始的线性模型LR，发展到带有特征交叉的FM算法，随着深度网络的发展，CTR预估也逐渐发展到如今的基于深度模型的CTR预估，期间出现了较大一批成功在业界得到广泛应用的算法模型，如Wide & Deep，DeepFM，DIN，DIEN等等。

2022-12-30

5550

人脸检测和对齐算法MTCNN

神经网络机器学习深度学习人工智能人脸识别

人脸识别在实际的生活中有着广泛的应用，得益于深度学习的发展，使得人脸识别的准确率得到大幅度提升。然而，为了做好人脸识别，第一步需要做的是对人脸检测，主要是通过对图片分析，定位出图片中的人脸。近年来，深度学习在人脸检测方面也得到了大力发展，在2016年Kaipeng Zhang, Zhanpeng Zhang等人提出了人脸检测算法MTCNN（Multi-task Cascaded Convolutional Networks）模型[1]，MTCNN算法的效果也是得到了很多实际项目的验证，在工业界得到了广泛的应用，在我个人的实际项目中也得到了较多应用。在MTCNN算法中，主要有三点的创新：

2022-12-23

1.1K0

空间金字塔池化Spatial Pyramid Pooling

机器学习神经网络深度学习人工智能

通常在卷积神经网络CNN中主要是由卷积层（包括Convolution和Pooling两部分组成）和全连接层组成，对于任意一张大小的图片，通常需要通过裁剪或者拉伸变形的方式将其转换成固定大小的图片，这样会影响到对图片的识别。Kaiming He等人在2015年提出了Spatial Pyramid Pooling的概念[1]，通过Spatial Pyramid Pooling操作后的CNN网络消除了对输入图像大小的限制，这样能够提升网络对图像的识别能力。

2022-11-30

5420

空间金字塔池化Spatial Pyramid Pooling

机器学习神经网络深度学习人工智能

通常在卷积神经网络CNN中主要是由卷积层（包括Convolution和Pooling两部分组成）和全连接层组成，对于任意一张大小的图片，通常需要通过裁剪或者拉伸变形的方式将其转换成固定大小的图片，这样会影响到对图片的识别。Kaiming He等人在2015年提出了Spatial Pyramid Pooling的概念[1]，通过Spatial Pyramid Pooling操作后的CNN网络消除了对输入图像大小的限制，这样能够提升网络对图像的识别能力。

2022-11-15

8251

卷积神经网络NIN

机器学习神经网络深度学习人工智能

在传统的CNN网络中，使用卷积（Convolution）操作来提取感受野中的特征，卷积操作是由一个线性变换与非线性激活函数组成，为了能增强CNN网络的局部辨识能力，2014年Network In Network[1]的结构被提出，其使用多层感知机的网络结构替换感受野上的线形变换和非线性激活函数，以此来增强模型的局部建模能力。

2022-11-13

4930

BERT知识蒸馏TinyBERT

诸如BERT等预训练模型的提出显著的提升了自然语言处理任务的效果，但是随着模型的越来越复杂，同样带来了很多的问题，如参数过多，模型过大，推理事件过长，计算资源需求大等。近年来，通过模型压缩的方式来减小模型的大小也是一个重要的研究方向，其中，知识蒸馏也是常用的一种模型压缩方法。TinyBERT[1]是一种针对transformer-based模型的知识蒸馏方法，以BERT为Teacher模型蒸馏得到一个较小的模型TinyBERT。四层结构的TinyBERT在GLUE benchmark上可以达到BERT的96.8%及以上的性能表现，同时模型缩小7.5倍，推理速度提升9.4倍。六层结构的TinyBERT可以达到和BERT同样的性能表现。

2022-11-12

3810

BERT知识蒸馏Distilled BiLSTM

机器学习神经网络深度学习人工智能

随着BERT模型的提出，在NLP上的效果在不断被刷新，伴随着计算能力的不断提高，模型的深度和复杂度也在不断上升，BERT模型在经过下游任务Fine-tuning后，由于参数量巨大，计算比较耗时，很难真正上线使用。这些基于Transformer模型的提出，包括BERT，GPT等，那么对于传统的NLP方法，如RNN，LSTM，TextCNN是不是就已经过时了呢？结合知识蒸馏的思想，Distilled BiLSTM[1]将BERT模型当作Teacher模型，对Fine-tuned BERT进行蒸馏，使得蒸馏得到的Student模型BiLSTM模型与ELMo模型具有相同的效果，但是参数量却减小了100倍，同时，计算时间缩短了15倍。

2022-09-29

6630

Transformer的基本原理

机器学习神经网络深度学习人工智能

Seq2Seq[1]框架最初是在神经机器翻译（Neural Machine Translation，NMT）领域中提出，用于将一种语言（sequence）翻译成另一种语言（sequence）。其结构如下图所示：

2022-09-26

9940

机器学习神经网络深度学习人工智能编程算法

很多的图像处理问题可以转换成图像到图像（Image-to-Image）的转换，即将一个输入图像翻译成另外一个对应的图像。通常直接学习这种转换，需要事先定义好损失函数，然而对于不同的转换任务，需要设计的损失函数也不尽相同。得益于生成对抗网络GAN的提出，尤其是条件生成对抗网络cGAN[1]（conditional GAN），可以直接学习这种映射关系，同时不需要人工定义该映射的损失函数，可以通过自动的学习得到。基于cGAN的基本原理，Pix2Pix[2]提出了一种图像转图像的通用框架。Pix2Pix网络不仅能够学习到从输入图像到输出图像的映射，还能学习到用于训练该映射的损失函数。

2022-05-18

1890

文本生成seq2seq框架

机器学习神经网络深度学习人工智能编程算法

Seq2Seq是Sequence to Sequence的缩写，作用是将一个序列（sequence）映射成另一个序列（sequence）。文献[1]和文献[2]分别提出利用深度神经网络DNN实现端到端的Seq2Seq学习，将Seq2Seq应用于神经机器翻译（Neural Machine Translation，NMT），唯一不同的是在[1]中使用LSTM作为基础网络，而在[2]中则是使用的是RNN。在Seq2Seq框架中包含了两个模块，一个是encoder模块，另一个是decoder模块。这种同时包含encoder和decoder的结构与AutoEncoder网络相似，不同的是AutoEncoder模型是将输入通过encoder的网络生成中间的结果，并通过decoder对中间的结果还原，AutoEncoder的模型结构如下图所示：

2022-05-12

5630

Embeddings from Language Models（ELMo）

机器学习神经网络深度学习人工智能

随着深度学习在NLP领域的发展，产生很多深度网络模型用于求解各类的NLP问题，在这众多的网络模型中，无疑都会使用到词向量的概念，这就不得不提及word2vec[1]词向量生成工具。从word2vec词向量工具的提出后，预训练的词向量成了众多NLP深度模型中的重要组成部分。然而传统的word2vec生成的词向量都是上下文无关的，其生成的词向量式固定，不会随着上下文的改变而改变，这种固定的词向量无法解决一词多义的问题。比如“bank”这个词，既可以表示“河岸”，也可以表示“银行”。Embeddings from Language Models（ELMo）[2]是2018年提出的一种基于上下文的预训练模型，研究人员认为一个好的预训练语言模型应该能够包含丰富的句法和语义信息, 并且能够对多义词进行建模。

2022-05-12

4400

Deep Learning Recommendation Model（DLRM）

编程算法深度学习

DLRM（Deep Learning Recommendation Model）[1]是Facebook在2019年提出的用于处理CTR问题的算法模型，与传统的CTR模型并没有太大的差别，文章本身更注重的是工业界对于深度模型的落地，在文中介绍了很多深度学习在实际落地过程中的细节，包括如何高效训练。在此我们更多的是关注模型本身，尝试揭开DLRM模型的本质。在DLRM模型中，突出解决两个问题：

2022-05-12

9480

人脸识别系统FaceNet原理

人脸识别编程算法深度学习批量计算

近年来，随着深度学习在CV领域的广泛应用，人脸识别领域也得到了巨大的发展。在深度学习中，通过多层网络的连接，能够学习到图像的特征表示，那么两张人脸的图像，是不是可以通过深度学习判别其是否是相同的人呢？Google在2015年提出了人脸识别系统FaceNet[1]，可以直接将人脸图像映射到欧式空间中，空间中的距离直接代表了人脸的相似度。最终，FaceNet在LFW数据集上，准确率为0.9963，在YouTube Faces DB数据集上，准确率为0.9512。FaceNet的主要优化点是：

2022-05-12

5.9K0

Conditional GAN

机器学习神经网络深度学习人工智能 javascript

GAN的出现为数据生成提供了一种新的思路，以图像生成为例，在GAN框架中，不再需要其他复杂的操作，如Markov Chain等，只需要对定义好的网络进行backpropagation即可完成生成网络的训练。在原始的GAN框架中，包括了两个部分，分别为生成网络（Generator）G和判别网络（Discriminator），其中生成网络（Generator）用于生成图片，判别网络（Discriminator）用于判别一张图片是否是真实的。通过不断提高生成网络的生成质量，最终“骗”过判别网络，在此过程中，判别网络也在不断提高自身的判别能力，通过如此的一个动态的“博弈”过程，最终，训练好的生成网络便可以用于生成“以假乱真”的图片。

2022-05-12

2430

生成对抗网络GAN

机器学习神经网络深度学习人工智能

生成对抗网络GAN（Generative adversarial nets）[1]是由Goodfellow等人于2014年提出的基于深度学习模型的生成框架，可用于多种生成任务。从名称也不难看出，在GAN中包括了两个部分，分别为”生成”和“对抗”，整两个部分也分别对应了两个网络，即生成网络（Generator）和判别网络（Discriminator），为描述简单，以图像生成为例：

2022-05-12

7860

深度卷积生成对抗网络DCGAN

机器学习深度学习人工智能神经网络卷积神经网络

在原始的GAN[1]中，生成网络和判别网络使用的都是前馈神经网络MLP。随着深度学习技术的发展，得益于卷积神经网络CNN在图像领域的成功，在DCGAN[2]中尝试将CNN与GAN相结合，用CNN网络替换GAN的生成网络和判别网络中的MLP，同时在训练的过程中使用了一些技巧来避免模型崩溃和模型不收敛等问题。

2022-05-12

5100

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态