前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >资源 | 基于神经网络的命名实体识别 NeuroNER

资源 | 基于神经网络的命名实体识别 NeuroNER

作者头像
机器之心
发布2018-05-08 15:32:20
7880
发布2018-05-08 15:32:20
举报
文章被收录于专栏:机器之心机器之心

选自Neuroner

机器之心编译

参与:李亚洲

本文主要介绍了一种基于神经网络的命名实体识别系统 NeuroNER,并附上了安装、下载的项目地址,希望对自然语言处理感兴趣的同学有所帮助。

NeuroNER 下载项目地址:https://github.com/Franck-Dernoncourt/NeuroNER

什么是命名实体识别(NER)?

NER 旨在识别文本中的有趣实体,例如位置、组织和时序表达。识别实体可被用于各种下游应用,比如病历去识别化(de-identification)和信息提取系统,也可作为其他自然语言处理任务机器学习系统的特征。

NeuroNER 能做什么?

NeuroNER 是一个能完成 NER 任务的项目:

NeuroNER 相比于已由的 NER 系统,能提供以下优势:

  • 利用神经网络的顶尖预测能力(也就是深度学习)
  • 让用户能够创造新的语料库或修改已有语料库
  • 它是跨平台的、开源的、免费直接使用的

如何使用 NeuroNER?

下图对 NeuroNER 的功能做出了简要介绍,具体描述如下:

  • 训练神经网络完成 NER 任务。在训练的过程中,NeuroNER 允许监控网络。
  • 评估 NeuroNER 所做预测的质量。表现标准可通过预测标签与金色标签的对比来计算、标绘。如果测试集与训练和验证集同时提供,评估也可在训练的同时完成,或者在训练后分开完成,或者使用预训练模型。
  • 部署 NeuroNER 作为产品使用:NeuroNER 标记了部署集,也就是没有金色标签的新文本。

NeuroNER 引擎如何工作?

NeuroNER 引擎基于人工神经网络,特别是依赖一种循环神经网络的变体 LSTM。NER 引擎的人工神经网络包含三层:

  • 字符增强的 token 嵌入(Character-enhanced token-embedding)层
  • 标签预测层
  • 标签序列优化层

下图展现了 NeuroNER 引擎中用到的人工神经网络的架构:

如何安装 NeuroNER

GitHub 上的 repository 解释了安装指南,以下视频展示了使用安装脚本在 Ubuntu 上进行安装有多么简单:脚本会安装你所需的所有东西,然后在 CoNLL-2003 数据集上进行训练。在数个训练 epoch 之后,模型获得了顶尖的成果。

视频内容

原文链接:http://neuroner.com/

本文为机器之心编译,转载请联系本公众号获得授权。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-06-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档