首页标签自然语言处理

#自然语言处理

人工智能和语言学领域的分支学科

基于GPT2制作一个chatbot

大鹅

腾讯 · 后台开发 (已认证)

想必大家都有经历,处于多种原因有个很好的朋友不再跟你聊天了,那么可不可以用他的微信聊天记录来大致还原一下这个人的聊天习惯语气甚至是喜欢发的表情包等等呢?

20660

NLP随笔(四)

XianxinMao

70 年代以后随着互联网的高速发展,语料库越来越丰富以及硬件更新完善,自然语言处理思潮由理性主义向经验主义过渡,基于统计的方法逐渐代替了基于规则的方法。

9300

NLP随笔(二)

XianxinMao

当 AI 在某一个单点任务上的表现接近或者超越人类的时候,就会给行业带来巨大的商机。在视觉分类、检索、匹配、目标检测等各项任务上,随着相关算法越来越准确,业界也...

5930

NLP随笔(一)

XianxinMao

20 世纪50 年代中期到80 年代初期的感知器,20世纪80 年代初期至21世纪初期的专家系统,以及最近十年的深度学习技术,分别是三次热潮的代表性产物

6320

Taking advantage of context features

XianxinMao

In the featurization tutorial we incorporated multiple features beyond just user...

6700

text classification with RNN

XianxinMao

本次用到的数据集是 IMDB,一共有 50000 条电影评论,其中 25000 条是训练集,另外 25000 条是测试集

10420

打造一个window桌面应用:在线聊天对话机器人

Python研究者

今天辰哥教大家做一个在线聊天对话机器人桌面应用,已经打包成exe可执行文件,读者可以直接拿来使用, 先上演示图

11300

如何实现实时文本过滤

colorknight

对文本数据进行实时过滤的需求在舆情类系统的开发过程中经常碰到。如:对涉黄、涉政、涉恐文本的过滤;对广告数据的过滤;以及对非业务数据的过滤等。这些过滤需求由于比较...

11500

arXiv | 如何更好地理解自然语言?自训练+预训练

DrugAI

今天给大家介绍的是Facebook AI研究团队发表在arXiv上的一篇文章“Self-training Improves Pre-training for N...

18730

【关于 NLP】百问百答

杨夕

本项目是作者们根据个人面试和经验总结出的自然语言处理(NLP)面试准备的学习笔记与资料,该资料目前包含 自然语言处理各领域的 面试题积累。

18261

【关于 NLP】百问百答

杨夕

本项目是作者们根据个人面试和经验总结出的自然语言处理(NLP)面试准备的学习笔记与资料,该资料目前包含 自然语言处理各领域的 面试题积累。

20420

【关于 Elmo】 那些你不知道的事

杨夕

11400

【关于 fastText】 那些你不知道的事

杨夕

在前面,我们已经介绍和比较了 word-level 和 character-level 的优缺点,并根据其特点,提出一种介于 word-level Model ...

17900

【关于 TF-idf】 那些你不知道的事

杨夕

由于计算机无法识别 文本语言,所以需要将文本数字化,one-hot 方法最早的一种将 文本数字化的方法。

9100

ProGen:蛋白质生成语言模型

DrugAI

最近的研究开始利用更大规模的原始蛋白质序列数据集,采用最先进的表示学习技术,将自然语言处理(NLP)方法应用到蛋白质属性分类。然而,还并未有人尝试采用最先进的人...

21860

BERTology遇上生物学:深入理解蛋白质语言模型中的注意力机制

DrugAI

今天给大家介绍Salesforce Research投稿在ICLR2021上的一项工作。在很多蛋白质任务中,Transformer模型被用来学习蛋白质的有效表示...

22850

DialoGPT:大规模预训练的对话响应模型

DrugAI

今天给大家介绍的是由微软Yizhe Zhang等人发表在arXiv上的文章”DialoGPT: Large-Scale Generative Pre-train...

46940

J Cheminform.|基于子结构的神经机器翻译用于逆合成预测

DrugAI

随着机器翻译方法的快速改进,神经机器翻译已经开始在逆合成设计中发挥重要作用,为目标分子找到合理的合成路径。以往的研究表明,利用神经机器翻译的序列到序列框架是解决...

14830

PLUS | 包含蛋白质特异性的新型预训练方案

DrugAI

今天给大家介绍来自首尔国立大学Sungroh Yoon课题组在arXiv上发表的一篇文章。作者指出当前很多方法采用半监督学习来进行蛋白质序列建模,其中的预训练方...

18860

ICLR2020 | StructBERT : 融合语言结构的BERT模型

DrugAI

今天给大家介绍阿里巴巴达摩院在ICLR2020的一篇论文,该研究针对预训练语言模型BERT在预训练任务中忽略了语言结构的问题,作者对BERT进行扩展,通过加入语...

17650

扫码关注云+社区

领取腾讯云代金券