首页标签自然语言处理

#自然语言处理

人工智能和语言学领域的分支学科

Taking advantage of context features

XianxinMao

In the featurization tutorial we incorporated multiple features beyond just user...

400

text classification with RNN

XianxinMao

本次用到的数据集是 IMDB,一共有 50000 条电影评论,其中 25000 条是训练集,另外 25000 条是测试集

8520

打造一个window桌面应用:在线聊天对话机器人

Python研究者

今天辰哥教大家做一个在线聊天对话机器人桌面应用,已经打包成exe可执行文件,读者可以直接拿来使用, 先上演示图

9800

如何实现实时文本过滤

colorknight

对文本数据进行实时过滤的需求在舆情类系统的开发过程中经常碰到。如:对涉黄、涉政、涉恐文本的过滤;对广告数据的过滤;以及对非业务数据的过滤等。这些过滤需求由于比较...

6700

arXiv | 如何更好地理解自然语言?自训练+预训练

DrugAI

今天给大家介绍的是Facebook AI研究团队发表在arXiv上的一篇文章“Self-training Improves Pre-training for N...

14230

【关于 NLP】百问百答

杨夕

本项目是作者们根据个人面试和经验总结出的自然语言处理(NLP)面试准备的学习笔记与资料,该资料目前包含 自然语言处理各领域的 面试题积累。

15961

【关于 NLP】百问百答

杨夕

本项目是作者们根据个人面试和经验总结出的自然语言处理(NLP)面试准备的学习笔记与资料,该资料目前包含 自然语言处理各领域的 面试题积累。

14020

【关于 Elmo】 那些你不知道的事

杨夕

8100

【关于 fastText】 那些你不知道的事

杨夕

在前面,我们已经介绍和比较了 word-level 和 character-level 的优缺点,并根据其特点,提出一种介于 word-level Model ...

12700

【关于 TF-idf】 那些你不知道的事

杨夕

由于计算机无法识别 文本语言,所以需要将文本数字化,one-hot 方法最早的一种将 文本数字化的方法。

7700

ProGen:蛋白质生成语言模型

DrugAI

最近的研究开始利用更大规模的原始蛋白质序列数据集,采用最先进的表示学习技术,将自然语言处理(NLP)方法应用到蛋白质属性分类。然而,还并未有人尝试采用最先进的人...

17360

BERTology遇上生物学:深入理解蛋白质语言模型中的注意力机制

DrugAI

今天给大家介绍Salesforce Research投稿在ICLR2021上的一项工作。在很多蛋白质任务中,Transformer模型被用来学习蛋白质的有效表示...

19350

DialoGPT:大规模预训练的对话响应模型

DrugAI

今天给大家介绍的是由微软Yizhe Zhang等人发表在arXiv上的文章”DialoGPT: Large-Scale Generative Pre-train...

27730

J Cheminform.|基于子结构的神经机器翻译用于逆合成预测

DrugAI

随着机器翻译方法的快速改进,神经机器翻译已经开始在逆合成设计中发挥重要作用,为目标分子找到合理的合成路径。以往的研究表明,利用神经机器翻译的序列到序列框架是解决...

12030

PLUS | 包含蛋白质特异性的新型预训练方案

DrugAI

今天给大家介绍来自首尔国立大学Sungroh Yoon课题组在arXiv上发表的一篇文章。作者指出当前很多方法采用半监督学习来进行蛋白质序列建模,其中的预训练方...

13260

ICLR2020 | StructBERT : 融合语言结构的BERT模型

DrugAI

今天给大家介绍阿里巴巴达摩院在ICLR2020的一篇论文,该研究针对预训练语言模型BERT在预训练任务中忽略了语言结构的问题,作者对BERT进行扩展,通过加入语...

13050

ICLR 2020| VL-BERT:预训练视觉-语言模型

DrugAI

今天介绍中国科学技术大学和微软亚洲研究院朱西洲老师团队在ICLR2020的论文,该研究提出了一种新的图形神经网络的几何聚合方式,其核心思想是:在bert的基础上...

13060

人工智能(AI)遇上仿制药

DrugAI

仿制药比同类新药需要更少的研发。用于研发的AI应用似乎并不是仿制药公司最突出的解决方案。尽管缺乏优先级,但AI可能在很多领域可以帮助仿制药公司。

14540

制药业中的自然语言处理(NLP)

DrugAI

自然语言处理(NLP)在制药业的使用似乎少于机器视觉和预测分析等AI方法,但尽管如此,NLP在制药业仍有一些应用。该行业主要处理结构化数据,但是在某些业务领域中...

14360

腾讯云释义最佳实践

早起有点困

腾讯云释义(Tencent Cloud Explanation,TCEX)是一款为开发者提供的简单易用的内容解析工具。该工具集成了腾讯云光学字符识别(OCR)和...

20570

扫码关注云+社区

领取腾讯云代金券