Hanlp使用Bug记录

最近一直比较忙,好多私信也没时间回复。以后要完全从CV转NLP,所以博客内容可能要作调整了。

Hanlp是最近学习的一个自然语言处理包,本篇文章将一些使用过程之中遇到的bug放到这里做一个备忘记录,有时间一并联系作者更改。

-Predefine类的好多预定义tag没有在核心词典中。

这个造成的问题就是函数

/**

* 获取词语的ID

* @param a 词语

* @return ID,如果不存在,则返回-1

*/

public static int getWordID(String a)

{

return CoreDictionary.trie.exactMatchSearch(a);

}

没有在核心词典中,搜索不到,返回-1,造成后面IndexOutOfBoundException.

文章来源于lansatiankong的博客

原文链接:http://blog.51cto.com/13993767/2296097

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Spark学习技巧

第5篇:数据库系统的实现

前言 前面的文章中,主要都是在围绕关系数据库理论进行研究,没有涉及到数据库系统的具体实现。 虽说数据库系统的具体实现因业务环境,RDBMS等因素而异,但总体开发...

3107
来自专栏大数据和云计算技术

NoSQL 还是 SQL ?这一篇讲清楚

1.NoSQL的诞生原因 随着互联网快速发展,各种类型的应用层出不穷,所以导致在这个云计算的时代,对技术提出了更多的需求,主要体现在下面这四个方面: 低延迟的读...

3584
来自专栏java工会

Android开发中,你能控制什么?

在开发PC端桌面程序时,作为开发人员,我们可以主宰一切。打开窗口,打开对话框,保存数据库,完全不用考虑太多。但是在开发安卓应用时,我们可能就感觉没有那么“爽”了...

652
来自专栏ATYUN订阅号

数据虚拟化:为人工智能和机器学习解锁数据

在可靠性、准确性和性能方面,人工智能和机器学习都严重依赖于大型设备。因为数据池越大,你就越能对模型进行训练。这就是为什么重要的数据平台能够高效地处理不同的数据流...

38311
来自专栏微信公众号:Java团长

Java开发进销存管理系统

上面简单的展示了完成后的系统测试截图,你可以下载war包部署到自己的tomcat上看,下面开始进入正文。

1K4
来自专栏张善友的专栏

微软发布正式版SQL Server 2016

微软于今天在SQL 官方博客上宣布 SQL Server 数据库软件的正式发布版本(GA),历时一年多,微软为该软件发布了多个公共预览版和候选版本,而今天最终...

2046
来自专栏数据和云

背后那双手 - Evernote服务迁移到GCP的技术支持和方法论

编辑手记:Evernote在70天的时间里完成了3PB数据迁移至云端,整个过程竟然实现用户零感知。那么迁移过程到底使用了什么样的技术,我们一起来学习。 回顾:...

3075
来自专栏企鹅号快讯

分库分表架构实践

作者介绍: 丁浪,现就职于某垂直电商平台,担任技术架构师。关注高并发、高可用的架构设计,对系统服务化、分库分表、性能调优等方面有深入研究和丰富实践经验。热衷于技...

40410
来自专栏Hadoop数据仓库

HAWQ取代传统数仓实践(二)——搭建示例模型(MySQL、HAWQ)

一、业务场景         本系列实验将应用HAWQ数据库,为一个销售订单系统建立数据仓库。本篇说明示例的业务场景、数据仓库架构、实验环境、源和目标库的建立过...

2768
来自专栏杨建荣的学习笔记

和开发讨论的一个数据变更需求(r9笔记第8天)

最近在评估一个开发同事的需求时,发现随着需求的变化,DBA相关的评估工作也会随之变化,同时反射到开发同事那边,通过这个案例也可以看到很多的需求变化,可以从中看出...

3345

扫码关注云+社区

领取腾讯云代金券