小小挖掘机

116 篇文章
66 人订阅

全部文章

石晓文

美团点评 · 算法实习生 (已认证)

《美团机器学习实践》—— 思维导图

962
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(二十九)--协同记忆网络理论及实践

协同过滤(collaborative filtering)是推荐系统中经典的一类方法。协同过滤中比较经典的解法有基于邻域方法、矩阵分解等,这些方法都有各自的优点...

803
石晓文

美团点评 · 算法实习生 (已认证)

「回顾」强化学习在自然语言处理中的应用

本文首先介绍了强化学习的概念和相关知识,以及与监督学习的区别,然后就强化学习在自然语言处理应用中的挑战和优势进行了讨论。

692
石晓文

美团点评 · 算法实习生 (已认证)

GAIL:一种结合GAN思想的反向强化学习方法

前几天听到一声广告语:只要你愿意,从现在开始努力,最坏的结果不过是大器晚成。好了,既然我们决定要努力,要怎么做呢?我们要有自己的一套方法论,如何得到自己的方法论...

823
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(三十)--深度矩阵分解模型理论及实践

本文提出了一种基于神经网络结构的矩阵分解模型。该模型综合考虑了用户对物品的显式评分和非偏好隐式反馈,然后通过两组神经网络将用户和物品的特征提取到一个低维空间;并...

925
石晓文

美团点评 · 算法实习生 (已认证)

Categorical DQN-一种建模价值分布的深度强化学习方法!

之前介绍的DQN及其各种变体,网络输出的都是状态-动作价值Q的期望预估值。而本文将介绍的Categorical DQN,它建模的是状态-动作价值Q的分布。这样的...

1342
石晓文

美团点评 · 算法实习生 (已认证)

Rainbow:整合DQN六种改进的深度强化学习方法!

在2013年DQN首次被提出后,学者们对其进行了多方面的改进,其中最主要的有六个,分别是: Double-DQN:将动作选择和价值估计分开,避免价值过高估计 D...

1351
石晓文

美团点评 · 算法实习生 (已认证)

numpy中的hstack()、vstack()、stack()、concatenate()函数详解

本文主要介绍一下numpy中的几个常用函数,包括hstack()、vstack()、stack()、concatenate()。

1964
石晓文

美团点评 · 算法实习生 (已认证)

强化学习反馈稀疏问题-HindSight Experience Replay原理及实现!

在强化学习中,反馈稀疏是一个比较常见同时令人头疼的问题。因为我们大部分情况下都无法得到有效的反馈,模型难以得到有效的学习。为了解决反馈稀疏的问题,一种常用的做法...

1603
石晓文

美团点评 · 算法实习生 (已认证)

增强模型的探索能力-强化学习NoisyNet原理及实现!

增加Agent的探索能力是强化学习中经常遇到的问题,一种常用的方法是采用e-greedy的策略,即以e的概率采取随机的动作,以1-e的概率采取当前获得价值最大的...

852
石晓文

美团点评 · 算法实习生 (已认证)

一步步解析Attention is All You Need!

本文将通过细节剖析以及代码相结合的方式,来一步步解析Attention is all you need这篇文章。

1862
石晓文

美团点评 · 算法实习生 (已认证)

万字长文带你复习线性代数!

课程主页:http://speech.ee.ntu.edu.tw/~tlkagk/courses_LA16.html

902
石晓文

美团点评 · 算法实习生 (已认证)

强化学习AC、A2C、A3C算法原理与实现!

跟着李宏毅老师的视频,复习了下AC算法,新学习了下A2C算法和A3C算法,本文就跟大家一起分享下这三个算法的原理及tensorflow的简单实现。

2463
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(二十八)--知识图谱与推荐系统结合之MKR模型原理及实现

依次训练的方法主要有:Deep Knowledge-aware Network(DKN) 联合训练的方法主要有:Ripple Network 交替训练主要采用m...

1112
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(二十七)--知识图谱与推荐系统结合之RippleNet模型原理及实现

依次训练的方法主要有:Deep Knowledge-aware Network(DKN) 联合训练的方法主要有:Ripple Network 交替训练主要采用m...

1203
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(二十四)--深度兴趣进化网络DIEN原理及实战!

在本系列的推荐系统遇上深度学习(十八)--探秘阿里之深度兴趣网络(DIN)浅析及实现中,我们介绍了阿里的深度兴趣网络(Deep Interest Network...

1412
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(二十五)--当知识图谱遇上个性化推荐

之前在美团听过关于知识图谱和个性化推荐的一个讲座,接下来的几篇,我们将围绕讲座中提到的知识点,来介绍下知识图谱是如何同个性化推荐相结合的!本篇算是一个开篇吧,希...

1431
石晓文

美团点评 · 算法实习生 (已认证)

推荐系统遇上深度学习(二十六)--知识图谱与推荐系统结合之DKN模型原理及实现

在本系列的上一篇中,我们大致介绍了一下知识图谱在推荐系统中的一些应用,我们最后讲到知识图谱特征学习(Knowledge Graph Embedding)是最常见...

2323
石晓文

美团点评 · 算法实习生 (已认证)

时间序列预测模型-ARIMA原理及Python实现!

再介绍本篇的内容之前,我们先来看一下本文用到的数据。本文用到的中国银行股票数据下载:http://pan.baidu.com/s/1gfxRFbH。

1702
石晓文

美团点评 · 算法实习生 (已认证)

残差网络ResNet网络原理及实现

论文地址:https://arxiv.org/pdf/1512.03385.pdf

1313

扫码关注云+社区