前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NLP | 实用文本标注工具推荐

NLP | 实用文本标注工具推荐

作者头像
Ediwnaalee
修改2020-03-05 14:13:18
5.4K0
修改2020-03-05 14:13:18
举报

从事NLP以来,最常接触的就是各种文本标注工具,现在网上能找到的支持中文文本标注的开源工具不多。在我们团队发展前期,尝试了很多不同的开源工具,像是BRAT,YEDDA,DeepDive,由于之前做的大多是实体标注的项目,这些开源工具基本可以满足需求,但在使用过程中也存在着诸多不便,比如安装过程十分复杂,界面都是英文的,交互做的不够清晰,这些对标注人员都很不友好。

随着NLP算法应用发展,数据训练需要能同时进行实体标注和文本分类的文本标注工具,而这些开源工具都很难满足,分开标注效率又太低,好在之前就关注过的一个京东数科旗下的免费数据标注平台上线了实体标注和文本分类结合的文本标注工具,正好能满足我们项目的需求,经过一段时间的体验后,说一下使用心得,供大家参考。

平台名称:京东众智-开放标注平台

网址:https://biao.jd.com/bz

工具名称:实体提取及文章理解

这个工具最大的特点就是可以同时进行实体标注和文本分类,当然也可以选择只做其中一种。

整体标注界面是这样的,在页面右侧选择文章整体判断标签,左侧正文处选中语句标注关键词,关键词可以设置上下级关系。整体来说,没有一点多余的东西,非常简单易操作。

标注工具整体操作页面
标注工具整体操作页面

这个工具还有一个很棒的小细节,可以嵌套标注,对于我们做的一些事件提取判断类的项目有很大帮助,如下图所示:

嵌套标注
嵌套标注

同时,平台还提供管理标注人员的后台系统,可以精确到每个标注人员的管理,帮助我们提升了项目准确率和工作效率。整体来说,这个文本标注工具非常适合我们的项目,有类似需求的同行可以关注一下。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档