深度学习自然语言处理-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

深度学习自然语言处理

专栏成员

1035

文章

1347260

阅读量

164

订阅数

论文清单：一文梳理因果推理在自然语言处理中的应用

https 网络安全 github git 开源

每天给你送来NLP技术干货！ ---- ©作者 | 肖之仪单位 | 北京邮电大学研究方向 | 因果推理、对话系统来自 | PaperWeekly 这篇文章是由笔者根据自然语言顶级会议收录有关于因果推断的文献整理而成，内容包括论文的基本信息以及阅读笔记。他山之石 1. Papers about Causal Inference and Language https://github.com/causaltext/causal-text-papers 2. Causality for NLP Read

2022-09-09

1.2K0

ACL2022 关系抽取相关论文泛读

https 网络安全 github git 开源

每天给你送来NLP技术干货！ ---- 写在前面今天给大家分享的是是ACL 2022上与实体关系抽取相关的部门论文范读笔记。其中有一些小喵自己也在学习，后续会推出精读笔记。 1. DocRE 论文名称：《Document-Level Relation Extraction with Adaptive Focal Loss and Knowledge Distillation》论文链接：https://aclanthology.org/2022.findings-acl.132.pdf 代码地址：htt

2022-08-31

2.3K0

当代研究生应当掌握的并行训练方法（单机多卡）

pytorch https 网络安全 github git

每天给你送来NLP技术干货！ ---- 排版：AI算法小喵 1. Take-Away 笔者使用 PyTorch 编写了不同加速库在 ImageNet 上的使用示例（单机多卡）。需要的同学可以当作 quickstart 将所需要的部分 copy 到自己的项目中（Github 请点击下面链接）： nn.DataParallel[1] 简单方便的 nn.DataParallel torch.distributed[2] 使用 torch.distributed 加速并行训练 torch.multiprocessi

2022-08-26

1.6K0

TinyBERT 蒸馏速度实现加速小记

https 网络安全 NLP 服务 github git

每天给你送来NLP技术干货！ ---- 编辑：AI算法小喵写在前面最近做的一个 project 需要复现 EMNLP 2020 Findings 的 TinyBERT[1]，本文是对复现过程对踩到坑，以及对应的解决方案和实现加速的一个记录。 1. Overview of TinyBERT BERT 效果虽好，但其较大的内存消耗和较长的推理延时会对其上线部署造成一定挑战。在内存消耗方面，一系列知识蒸馏的工作，例如 DistilBERT[2]、BERT-PKD[3] 和 TinyBERT 被提出来用以降

2022-08-26

7940

【建议收藏】5个优质NLP开源项目

github git https 网络安全 NLP 服务

1、OpenNRE OpenNRE 是基于 Tensorflow 开发的，一个用于神经网络关系提取的工具包，由清华大学刘知远老师及其团队贡献的开源项目。在该项目中，关系提取会分为嵌入、编码器、选择器和分类器四步。 Github 地址： https://github.com/thunlp/OpenNRE 2、中文序列标注Flat Lattice 原文《FLAT：Chinese NER Using Flat-Lattice Transformer》，解决的是中文命名实体识别的任务。文章提出的方法在多个数据集上达

2022-05-25

1.5K0

按照时间线帮你梳理10种预训练模型

https 网络安全 css github git

本文的主要目的是理清时间线，关注预训练的发展过程，进行模型间的联系和对比，具体原理和细节请参考原论文和代码，不再一一赘述。

2020-09-22

2K0

【ACL2020】对话数据集Mutual：论对话逻辑，BERT还差的很远

机器人 github git 开源 NLP 服务

自然语言处理是人工智能领域的掌上明珠，而人机对话则是自然语言处理领域的最终极一环。

2020-04-20

8590

【分词】从why到how的中文分词详解，从算法原理到开源工具

github git 开源 https 网络安全

分词（word tokenization），也叫切词，即通过某种方式将句子中的各个词语识别并分离开来，使得文本从“字序列”的表示升级为“词序列”表示。分词技术不仅仅适用于中文，对于英文、日文、韩文等语言也同样适用。

2020-02-27

1.2K0

【2019 NLP汇总】论文、博客、教程、工程进展全梳理（长文预警）

github git 开源 https http

2019 年对自然语言处理（NLP）来说是令人印象深刻的一年。本文将着重讲述一些 2019 年我在机器学习和自然语言处理领域有所见闻的重要事件。我会把重点主要放在自然语言处理上，但也会涉及若干人工智能领域的趣闻。主要内容包括研究论文、博客、工具和数据集、社区讨论、教程资源等。

2020-02-27

1K0

Transformers Assemble（PART I）

https 网络安全编程算法 github git

最近特别时期积极响应国家号召，宅在家没事干就捣鼓捣鼓公众号玩，刚好比较空就把之前的一些论文笔记搬运上来吧。之后也会佛系更新人工智能&自然语言处理方面相关内容，欢迎上车关注一波~

2020-02-25

4930

【数据集】机器学习数据集汇总（附下载地址）

https http 网络安全 github git

(Stanford)69G大规模无人机(校园)图像数据集【Stanford】 http://cvgl.stanford.edu/projects/uav_data/

2020-02-18

5.5K0

干货 | 120 道机器学习面试题！备战春招

腾讯云测试服务编程算法 github git 开源

直到今天，在各类媒体口中，数据科学家依然是“21世纪最性感的职业”。但事实上，希望进入这个行业的初级数据科学家已经供过于求。

2019-11-19

5780

初学者 | 分词的那些事儿

网络安全 https 中文分词 github git

本文谈一谈分词的那些事儿，从定义、难点到基本方法总结，文章最后推荐一些不错的实战利器。

2019-11-19

9560

初学者|一起来看看词性标注

https 网络安全 github git NLP 服务

本文根据自己的学习过程以及查阅相关资料的理解，对自然语言基础技术之词性标注进行了相对全面的简绍，包括定义、目前的难点以及常见方法，还推荐了一大波python实战利器，并且包括工具的用法。

2019-11-19

1.7K1

【资源】NLP 算法工程师相关的面试题

编程算法 github https NLP 服务 git

https://github.com/songyingxin/NLPer-Interview

2019-10-31

9740

没数据也能玩转BERT！无监督语义匹配实战

NLP 服务 github git 开源 https

对于字面上的匹配总体来说并不复杂，但实际效果就仅限于有字符交集的词语。若是想要上升到语义之间有相关度，就可以化归为学术界常见的语义匹配的问题。

2019-10-21

2.2K0

【干货】如何打造高质量的NLP数据集

NLP 服务 ide github git

无论是做研究还是解决业务问题，做数据集都是绕不开的问题。很多刚入行的同学觉得发布一个数据集是最容易灌水的了，燃鹅如果你真的做过就会发现，随意产生一个数据集很容易，但是若以解决实际问题或让大家能在上面磕盐玩耍为目的，来产生一个能用的、质量高的、难度适中的数据集一点都不容易，超级费时费脑子甚至费钱好不好(╯°□°）╯︵┻━┻

2019-08-19

1.7K0

【推荐】不到100行实现的全面NLP教程（pytorch+tensorflow）

NLP 服务 pytorch github git 开源

作者在每一个模型中，都用了一种实例来表示实现该模型，比如句子分类、机器翻译等。每个案例都对应一篇论文，大家可以对应论文再结合百行不到的代码，我相信你的理论与实践会进步的飞快的！

2019-07-12

1.8K0

【一分钟知识】依存句法分析

NLP 服务 github git 开源 https

本文简要介绍了自然语言处理中极其重要的句法分析，并侧重对依存句法分析进行了重点总结，包括定义、重要概念、基本方法、性能评价、依存分析数据集，最后，分享了一些流行的工具以及工具实战例子。

2019-07-12

1.6K0

干货 | 深度文本分类综述（12篇经典论文）

https 网络安全 github git 开源

最近有很多小伙伴想了解深度学习在文本分类的发展，因此，笔者整理最近几年比较经典的深度文本分类方法，希望帮助小伙伴们了解深度学习在文本分类中的应用。

2019-06-14

4.7K0

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态