首页
学习
活动
专区
工具
TVP
发布

深度学习自然语言处理

专栏作者
1009
文章
1173174
阅读量
161
订阅数
DataParallel里为什么会显存不均匀以及如何解决
鉴于网上此类教程有不少模糊不清,对原理不得其法,代码也难跑通,故而花了几天细究了一下相关原理和实现,欢迎批评指正!
zenRRan
2023-03-03
1K0
论文清单:一文梳理因果推理在自然语言处理中的应用
每天给你送来NLP技术干货! ---- ©作者 | 肖之仪 单位 | 北京邮电大学 研究方向 | 因果推理、对话系统 来自 | PaperWeekly 这篇文章是由笔者根据自然语言顶级会议收录有关于因果推断的文献整理而成,内容包括论文的基本信息以及阅读笔记。 他山之石 1. Papers about Causal Inference and Language https://github.com/causaltext/causal-text-papers 2. Causality for NLP Read
zenRRan
2022-09-09
1.1K0
ACL2022 关系抽取相关论文泛读
每天给你送来NLP技术干货! ---- 写在前面 今天给大家分享的是是ACL 2022上与实体关系抽取相关的部门论文范读笔记。其中有一些小喵自己也在学习,后续会推出精读笔记。 1. DocRE 论文名称:《Document-Level Relation Extraction with Adaptive Focal Loss and Knowledge Distillation》 论文链接:https://aclanthology.org/2022.findings-acl.132.pdf 代码地址:htt
zenRRan
2022-08-31
2.2K0
当代研究生应当掌握的并行训练方法(单机多卡)
每天给你送来NLP技术干货! ---- 排版:AI算法小喵 1. Take-Away 笔者使用 PyTorch 编写了不同加速库在 ImageNet 上的使用示例(单机多卡)。需要的同学可以当作 quickstart 将所需要的部分 copy 到自己的项目中(Github 请点击下面链接): nn.DataParallel[1] 简单方便的 nn.DataParallel torch.distributed[2] 使用 torch.distributed 加速并行训练 torch.multiprocessi
zenRRan
2022-08-26
1.5K0
TinyBERT 蒸馏速度实现加速小记
每天给你送来NLP技术干货! ---- 编辑:AI算法小喵 写在前面 最近做的一个 project 需要复现 EMNLP 2020 Findings 的 TinyBERT[1],本文是对复现过程对踩到坑,以及对应的解决方案和实现加速的一个记录。 1. Overview of TinyBERT BERT 效果虽好,但其较大的内存消耗和较长的推理延时会对其上线部署造成一定挑战。 在内存消耗方面,一系列知识蒸馏的工作,例如 DistilBERT[2]、BERT-PKD[3] 和 TinyBERT 被提出来用以降
zenRRan
2022-08-26
7070
【建议收藏】5个优质NLP开源项目
1、OpenNRE OpenNRE 是基于 Tensorflow 开发的,一个用于神经网络关系提取的工具包,由清华大学刘知远老师及其团队贡献的开源项目。在该项目中,关系提取会分为嵌入、编码器、选择器和分类器四步。 Github 地址: https://github.com/thunlp/OpenNRE 2、中文序列标注Flat Lattice 原文《FLAT:Chinese NER Using Flat-Lattice Transformer》,解决的是中文命名实体识别的任务。文章提出的方法在多个数据集上达
zenRRan
2022-05-25
1.3K0
医疗NLP相关数据集整理
链接:https://github.com/lrs1353281004/Chinese_medical_NLP
zenRRan
2020-09-22
10.6K0
按照时间线帮你梳理10种预训练模型
本文的主要目的是理清时间线,关注预训练的发展过程,进行模型间的联系和对比,具体原理和细节请参考原论文和代码,不再一一赘述。
zenRRan
2020-09-22
1.9K0
【ACL2020】对话数据集Mutual:论对话逻辑,BERT还差的很远
自然语言处理是人工智能领域的掌上明珠,而人机对话则是自然语言处理领域的最终极一环。
zenRRan
2020-04-20
8190
【分词】从why到how的中文分词详解,从算法原理到开源工具
分词(word tokenization),也叫切词,即通过某种方式将句子中的各个词语识别并分离开来,使得文本从“字序列”的表示升级为“词序列”表示。分词技术不仅仅适用于中文,对于英文、日文、韩文等语言也同样适用。
zenRRan
2020-02-27
1K0
【2019 NLP汇总】论文、博客、教程、工程进展全梳理(长文预警)
2019 年对自然语言处理(NLP)来说是令人印象深刻的一年。本文将着重讲述一些 2019 年我在机器学习和自然语言处理领域有所见闻的重要事件。我会把重点主要放在自然语言处理上,但也会涉及若干人工智能领域的趣闻。主要内容包括研究论文、博客、工具和数据集、社区讨论、教程资源等。
zenRRan
2020-02-27
9910
Transformers Assemble(PART I)
最近特别时期积极响应国家号召,宅在家没事干就捣鼓捣鼓公众号玩 ,刚好比较空就把之前的一些论文笔记搬运上来吧。之后也会佛系更新人工智能&自然语言处理方面相关内容,欢迎上车关注一波~
zenRRan
2020-02-25
4710
【NLP】45个小众而实用的NLP开源字典和工具
随着BERT、ERNIE、XLNet等预训练模型的流行,解决NLP问题时不用上预训练模型似乎总显得自己有点过时。但是这显然是不对的。
zenRRan
2020-02-20
1.4K0
【数据集】机器学习数据集汇总(附下载地址)
(Stanford)69G大规模无人机(校园)图像数据集【Stanford】 http://cvgl.stanford.edu/projects/uav_data/
zenRRan
2020-02-18
5.3K0
超8千Star,火遍Github的Python反直觉案例集!
Python,是一个设计优美的解释型高级语言,它提供了很多能让程序员感到舒适的功能特性。
zenRRan
2019-11-20
7020
杨杰博士莅临我校,并做了报告:Recent Advances in Sequence Labeling
之前了解杨杰博士是从导师那里得知的,模模糊糊,当时也只是知道这个名字而已,谁知道几个月后自己竟然还能作为迎宾亲自去迎接。O(∩_∩)O哈哈~ 路上交流了很多,发现大牛都是这么谦虚,平易近人的吗?
zenRRan
2019-11-19
9280
初学者|一文读懂命名实体识别
本文对自然语言基础技术之命名实体识别进行了相对全面的简绍,包括定义、发展历史、常见方法、以及相关数据集,最后推荐一大波python实战利器,并且包括工具的用法。
zenRRan
2019-11-19
1.4K0
干货 | 120 道机器学习面试题!备战春招
直到今天,在各类媒体口中,数据科学家依然是“21世纪最性感的职业”。但事实上,希望进入这个行业的初级数据科学家已经供过于求。
zenRRan
2019-11-19
5670
初学者 | 分词的那些事儿
本文谈一谈分词的那些事儿,从定义、难点到基本方法总结,文章最后推荐一些不错的实战利器。
zenRRan
2019-11-19
9240
初学者|一起来看看词性标注
本文根据自己的学习过程以及查阅相关资料的理解,对自然语言基础技术之词性标注进行了相对全面的简绍,包括定义、目前的难点以及常见方法,还推荐了一大波python实战利器,并且包括工具的用法。
zenRRan
2019-11-19
1.7K1
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档