linhw

LV0
发表了文章

【论文解读】基于图Transformer从知识图谱中生成文本

论文Text Generation from Knowledge Graphs with Graph Transformers发表于2019年自然语言处理顶级会...

linhw
发表了文章

Transformers中的Beam Search高效实现

在执行解码时,我们有几种选词方案,第一种则是穷举所有可能序列,这种成本过大无法承受。如果每一步都选择概率最大的词,这种解码方式叫做贪心搜索。然而,这种解码算法不...

linhw
发表了文章

交叉熵和极大似然估计的再理解

[1] http://willwolf.io/2017/05/18/minimizing_the_negative_log_likelihood_in_engl...

linhw
发表了文章

解锁竞赛新姿势-伪标签技术

伪标签技术现在几乎在所有的Kaggle数据竞赛中都会被提到或者使用到,而且很多情况下都可以帮助选手拿到更好的分数,伪标签技术作为一种半监督的方法,其实在很久之前...

linhw
发表了文章

深度学习笔记系列(三):极大似然估计

极大似然估计方法(Maximum Likelihood Estimate,MLE)也称为最大概似估计或最大似然估计,其作用是通过采样的样本分布去估计整个数据中的...

linhw
发表了文章

Transformer解码器详解

最近做fairseq的实验,发现之前对transformer的理解还是不够深入,尤其是解码器的部分,所以我又重新深入地了解了一下transformer解码器的构...

linhw
发表了文章

Polyaxon食谱 | 大规模深度学习应用训练平台使用笔记,让代码在集群上飞快跑起来

这是来自官方文档的介绍。就我理解而言,polyaxon依靠k8s部署在集群上,可以自主分配需要集群资源,创建简单,可重复,可移植的部署,依靠docker定制运行...

linhw
发表了文章

超全AI论文合集!涵盖NLP/CV/ML/多模态等众多方向!不用烦心寻找领域经典论文!

GitHub上汇聚了许多研究者发布的相关领域的资源清单,比如"awesome-relation-extraction", "awesome-sentiment-...

linhw
发表了文章

智源&计算所-互联网虚假新闻检测挑战赛(冠军)方案分享,代码已开源

比赛链接为 https://www.biendata.com/competition/falsenews/

linhw
发表了文章

[图解]FASTER R-CNN图文详解

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

linhw
发表了文章

Facebook:既能对话又能行动的冒险游戏研究平台LIGHT | EMNLP 2019

Jack Urbanek、Angela Fan等(FAIR、法国洛林国家信息及其应用研究所(LORIA-Nancy)、伦敦大学学院)

linhw
发表了文章

深度学习笔记系列(二):特征值,特征向量与SVD奇异值分解

本文是深度学习笔记系列文章,本次文章将介绍线性代数里比较重要的概念:特征值,特征向量以及SVD奇异值分解。

linhw
发表了文章

ACL2019论文阅读笔记——基于单句和双句打分的生成式摘要

论文Scoring Sentence Singletons and Pairs for Abstractive Summarization发表于2019年自然语...

linhw
订阅了专栏

腾讯云自媒体分享计划

3 文章3.5K 关注者
关注了用户

腾讯云自媒体分享计划

腾讯 · 产品运营 (已认证)

申请条件:至少有 20 篇或以上符合投稿要求可迁入腾讯云专栏的原创技术文章。

3 文章0 回答3.6K 关注者
创建了专栏

纸鱼AI

13 文章10 关注者

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券