首页
学习
活动
专区
工具
TVP
发布

深度学习自然语言处理

专栏成员
1035
文章
1347260
阅读量
164
订阅数
论文清单:一文梳理因果推理在自然语言处理中的应用
每天给你送来NLP技术干货! ---- ©作者 | 肖之仪 单位 | 北京邮电大学 研究方向 | 因果推理、对话系统 来自 | PaperWeekly 这篇文章是由笔者根据自然语言顶级会议收录有关于因果推断的文献整理而成,内容包括论文的基本信息以及阅读笔记。 他山之石 1. Papers about Causal Inference and Language https://github.com/causaltext/causal-text-papers 2. Causality for NLP Read
zenRRan
2022-09-09
1.2K0
ACL2022 关系抽取相关论文泛读
每天给你送来NLP技术干货! ---- 写在前面 今天给大家分享的是是ACL 2022上与实体关系抽取相关的部门论文范读笔记。其中有一些小喵自己也在学习,后续会推出精读笔记。 1. DocRE 论文名称:《Document-Level Relation Extraction with Adaptive Focal Loss and Knowledge Distillation》 论文链接:https://aclanthology.org/2022.findings-acl.132.pdf 代码地址:htt
zenRRan
2022-08-31
2.3K0
当代研究生应当掌握的并行训练方法(单机多卡)
每天给你送来NLP技术干货! ---- 排版:AI算法小喵 1. Take-Away 笔者使用 PyTorch 编写了不同加速库在 ImageNet 上的使用示例(单机多卡)。需要的同学可以当作 quickstart 将所需要的部分 copy 到自己的项目中(Github 请点击下面链接): nn.DataParallel[1] 简单方便的 nn.DataParallel torch.distributed[2] 使用 torch.distributed 加速并行训练 torch.multiprocessi
zenRRan
2022-08-26
1.6K0
TinyBERT 蒸馏速度实现加速小记
每天给你送来NLP技术干货! ---- 编辑:AI算法小喵 写在前面 最近做的一个 project 需要复现 EMNLP 2020 Findings 的 TinyBERT[1],本文是对复现过程对踩到坑,以及对应的解决方案和实现加速的一个记录。 1. Overview of TinyBERT BERT 效果虽好,但其较大的内存消耗和较长的推理延时会对其上线部署造成一定挑战。 在内存消耗方面,一系列知识蒸馏的工作,例如 DistilBERT[2]、BERT-PKD[3] 和 TinyBERT 被提出来用以降
zenRRan
2022-08-26
7940
【建议收藏】5个优质NLP开源项目
1、OpenNRE OpenNRE 是基于 Tensorflow 开发的,一个用于神经网络关系提取的工具包,由清华大学刘知远老师及其团队贡献的开源项目。在该项目中,关系提取会分为嵌入、编码器、选择器和分类器四步。 Github 地址: https://github.com/thunlp/OpenNRE 2、中文序列标注Flat Lattice 原文《FLAT:Chinese NER Using Flat-Lattice Transformer》,解决的是中文命名实体识别的任务。文章提出的方法在多个数据集上达
zenRRan
2022-05-25
1.5K0
按照时间线帮你梳理10种预训练模型
本文的主要目的是理清时间线,关注预训练的发展过程,进行模型间的联系和对比,具体原理和细节请参考原论文和代码,不再一一赘述。
zenRRan
2020-09-22
2K0
【ACL2020】对话数据集Mutual:论对话逻辑,BERT还差的很远
自然语言处理是人工智能领域的掌上明珠,而人机对话则是自然语言处理领域的最终极一环。
zenRRan
2020-04-20
8590
【分词】从why到how的中文分词详解,从算法原理到开源工具
分词(word tokenization),也叫切词,即通过某种方式将句子中的各个词语识别并分离开来,使得文本从“字序列”的表示升级为“词序列”表示。分词技术不仅仅适用于中文,对于英文、日文、韩文等语言也同样适用。
zenRRan
2020-02-27
1.2K0
【2019 NLP汇总】论文、博客、教程、工程进展全梳理(长文预警)
2019 年对自然语言处理(NLP)来说是令人印象深刻的一年。本文将着重讲述一些 2019 年我在机器学习和自然语言处理领域有所见闻的重要事件。我会把重点主要放在自然语言处理上,但也会涉及若干人工智能领域的趣闻。主要内容包括研究论文、博客、工具和数据集、社区讨论、教程资源等。
zenRRan
2020-02-27
1K0
Transformers Assemble(PART I)
最近特别时期积极响应国家号召,宅在家没事干就捣鼓捣鼓公众号玩 ,刚好比较空就把之前的一些论文笔记搬运上来吧。之后也会佛系更新人工智能&自然语言处理方面相关内容,欢迎上车关注一波~
zenRRan
2020-02-25
4930
【数据集】机器学习数据集汇总(附下载地址)
(Stanford)69G大规模无人机(校园)图像数据集【Stanford】 http://cvgl.stanford.edu/projects/uav_data/
zenRRan
2020-02-18
5.5K0
干货 | 120 道机器学习面试题!备战春招
直到今天,在各类媒体口中,数据科学家依然是“21世纪最性感的职业”。但事实上,希望进入这个行业的初级数据科学家已经供过于求。
zenRRan
2019-11-19
5780
初学者 | 分词的那些事儿
本文谈一谈分词的那些事儿,从定义、难点到基本方法总结,文章最后推荐一些不错的实战利器。
zenRRan
2019-11-19
9560
初学者|一起来看看词性标注
本文根据自己的学习过程以及查阅相关资料的理解,对自然语言基础技术之词性标注进行了相对全面的简绍,包括定义、目前的难点以及常见方法,还推荐了一大波python实战利器,并且包括工具的用法。
zenRRan
2019-11-19
1.7K1
【资源】NLP 算法工程师相关的面试题
https://github.com/songyingxin/NLPer-Interview
zenRRan
2019-10-31
9740
没数据也能玩转BERT!无监督语义匹配实战
对于字面上的匹配总体来说并不复杂,但实际效果就仅限于有字符交集的词语。若是想要上升到语义之间有相关度,就可以化归为学术界常见的语义匹配的问题。
zenRRan
2019-10-21
2.2K0
【干货】如何打造高质量的NLP数据集
无论是做研究还是解决业务问题,做数据集都是绕不开的问题。很多刚入行的同学觉得发布一个数据集是最容易灌水的了,燃鹅如果你真的做过就会发现,随意产生一个数据集很容易,但是若以解决实际问题或让大家能在上面磕盐玩耍为目的,来产生一个能用的、质量高的、难度适中的数据集一点都不容易,超级费时费脑子甚至费钱好不好(╯°□°)╯︵┻━┻
zenRRan
2019-08-19
1.7K0
【推荐】不到100行实现的全面NLP教程(pytorch+tensorflow)
作者在每一个模型中,都用了一种实例来表示实现该模型,比如句子分类、机器翻译等。每个案例都对应一篇论文,大家可以对应论文再结合百行不到的代码,我相信你的理论与实践会进步的飞快的!
zenRRan
2019-07-12
1.8K0
【一分钟知识】依存句法分析
本文简要介绍了自然语言处理中极其重要的句法分析,并侧重对依存句法分析进行了重点总结,包括定义、重要概念、基本方法、性能评价、依存分析数据集,最后,分享了一些流行的工具以及工具实战例子。
zenRRan
2019-07-12
1.6K0
干货 | 深度文本分类综述(12篇经典论文)
最近有很多小伙伴想了解深度学习在文本分类的发展,因此,笔者整理最近几年比较经典的深度文本分类方法,希望帮助小伙伴们了解深度学习在文本分类中的应用。
zenRRan
2019-06-14
4.7K0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档