前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GluonNLP让NPL变得更加简单

GluonNLP让NPL变得更加简单

作者头像
我被狗咬了
发布2019-09-23 10:21:23
1.1K0
发布2019-09-23 10:21:23
举报
文章被收录于专栏:Python乱炖

之前我们讲过NPL(自然语言处理),使用的是NLTK这样一个包,现在呢,我们又有了新的法宝----GluonNPL。在做自然语言处理上能帮我们提升不少效率。

GluonNLP提供了NLP中最先进的(SOTA)深度学习模型的实现,并为文本数据管道和模型构建块。它是为工程师,研究人员和学生设计的,以快速原型研究想法和产品基于这些模型。这个工具包提供了三个主要特性:

1、训练脚本复制SOTA结果报告在研究论文。

2、针对普通NLP任务的预训练模型。

3、精心设计的api大大降低了实现的复杂性。

安装:

代码语言:javascript
复制
pip install --pre --upgrade mxnet
代码语言:javascript
复制
pip install gluonnlp

在安装gluonnlp之前需要安装mxnet的依赖。

笔者在本地没有GPU的环境,就借用了谷歌的COLAB来试了一下。

COLAB地址:

https://colab.research.google.com/drive/1YLVDj7DLuEMjDOJI8rvi-HBveUoEbSnt#scrollTo=a5k2vooFJHKx

安装完之后我们就可以调用啦!

我们来看一个小小的例子:

比较两个单词baby和infant的相似度

我们可以看到输出的对比结果为0.740

我们可以看看使用gluonnlp是如何搭建评估模型和训练模型的:

首先导入相应的包:

设置一下环境:

初始化参数:

加载数据集,提取词汇表,对截断的BPTT进行数值化和批处理

加载预定义的语言模型:

分离梯度:

评估:

训练阶段:

训练和评估:

输出:

在这个示例中,我们看到:GluonNLP Toolkit提供了高级api,可以极大地简化NLP任务建模的开发过程。低级的NLP api可以轻松定制。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-09-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python乱炖 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档