专栏首页hadoop学习笔记中文自然语言处理工具HanLP源码包的下载使用记录
原创

中文自然语言处理工具HanLP源码包的下载使用记录

这篇文章主要分享的是hanlp自然语言处理源码的下载,数据集的下载,以及将让源代码中的demo能够跑通。Hanlp安装包的下载以及安装其实之前就已经有过分享了。本篇文章主要还是备忘之用,同时算是给新手朋友的一些参考吧!

不过在此之前先推荐两本书给想要学习中文自然语言处理的朋友,分别是《NLP汉语自然语言处理原理与实战》,里面介绍了汉语自然语言处理的相关技术,还有一些源码的解读;另一本是《python自然语言处理》。

下面就进入到本篇的正题,其实只需要下载源代码,下载字典和模型数据文件、下载配置文件,并且对配置文件稍作修改,然后再使用IDE打开源代码,就可以运行了,总的来说整个过程其实并不复杂。源代码、字典以及模型、配置文件的下载大家可以到GitHub上下载。

网页中提供了详细的说明,其实按照说明来就可以,下载以后将字典和模型文件解压到一个目录,建议放在工程名目录下:

data中就是模型文件和字典数据文件:

通过github提供的源代码下载链接下载下来的文件不包含hanlp.properties配置文件,这是你需要下载一个release版本的代码,解压以后,里面有一个hanlp.properties文件

将这个文件分别拷贝到解压以后的源代码target/classes和target-classes目录下

最后用ide打开源代码,我使用的ide工具是IDEA(Intellij),其他ide的操作应该大同小异,当然配置文件也许只需要一份就够了,不需要两个目录都拷贝,我这里没有验证,为保险起见,两个目录下都拷贝一份,读者可以试验一下,我这里主要目的是为了能跑通。

上述步骤完成之后,打开src/test/java/com.hankcs/demo下的demo,就可以跑出结果了,接下来,就顺藤摸瓜去读源代码吧

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • HanLP封装为web services服务的过程介绍

    前几天的召开的2019年大数据生态产业大会不知道大家关注到没有,看到消息是hanlp2.0版本发布了。不知道hanlp2.0版本又将带来哪些新的变化?准备近期看...

    IT小白龙
  • Hanlp分词1.7版本在Spark中分布式使用记录

    新发布1.7.0版本的hanlp自然语言处理工具包差不多已经有半年时间了,最近也是一直在整理这个新版本hanlp分词工具的相关内容。不过按照当前的整理进度,还需...

    IT小白龙
  • hanlp提取文本关键词的使用方法记录

    本文是csu_zipple 分享的关于使用hanlp汉语言处理包提取关键词的过程一个简单的记录分享。想要使用hanlp提取文本关键词的新手朋友们可以参考学习一下...

    IT小白龙
  • 微服务编排

    在 Jexia 中,我们相信微服务架构是组织我们的后端云的最佳方式 —— 它可以很好地进行关注分离(Separation of concerns),并为特定任务...

    StoneDemo
  • libcurl断点下载遇到的问题

    最近游戏把资源(图片、配置、lua)的加载、更新全部改了 ,加载其实还好,就是不走之前的zip解压方式。

    meteoric
  • PHP使用守护进程处理队列

      项目是棋牌,web架构是典型的lnmp,server产生的牌局通过http协议请求webserver,由php分析并持久化到mysql,中间参杂了很多业务逻...

    用户3094376
  • 淘宝的绝地求生:推出「小程序」到底是在反击微信,还是要打击京东

    此前,阿里巴巴生态链从业人士向媒体透露,手淘 App 将在今年三月份推出小程序,并表示,已有合作伙伴从阿里巴巴内部高层会议得知,推进手淘小程序一事势在必行。「手...

    知晓君
  • ​伪装的敏捷,我好累

    “敏捷已死”,人们一直这么说,但紧接着他们又说:“我们只是开个玩笑”。其实这些人真正想表达的是你实践敏捷的方式已经过时并且愚不可及,而“真正的”敏捷未死,只不过...

    CODING
  • R语言入门之创建新的变量

    ‍‍今天,米老鼠想和大家聊聊如何在R中创建新的变量。‍‍一般‍‍‍‍‍‍‍‍‍‍我们可以使用赋值符号 <- 来在数据中创建新的变量。下面我主要介绍三种创建新变量...

    生信与临床
  • Play Scala 2.5.x - Play with MongoDB 开发指南

    joymufeng

扫码关注云+社区

领取腾讯云代金券