windows环境下搭建python+nltk开发环境

nltk(Natural Language Tookit)实际上是python的一个开发包。对于自然语言处理任务非常有用。

===============================================================================================

NLTK 2.0官网http://nltk.org/install.html

===============================================================================================

在windows 32-bit 下的安装步骤如下:

1、Install Python

2、Install Numpy (optional)

3、Install NLTK

4、Install PyYAML

5、Test installation: Start>Python27, then type import nltk

===============================================================================================

1、首先,安装python 2.7

  详见http://blog.sina.com.cn/s/blog_8af1069601019opa.html

===============================================================================================

2、安装Numpy(可选操作)

http://sourceforge.net/projects/numpy/files/NumPy/1.6.2/numpy-1.6.2-win32-superpack-python2.7.exe/download

  -》直接下载

  -》双击运行,下一步下一步点击。

 -》安装完成。

===============================================================================================

3、安装NLTK。

  https://pypi.python.org/pypi/nltk/2.0.4

  -》nltk-2.0.4.win32.exe (md5)(Python 2.5 or higher)

  -》双击运行,一次点击下一步

 -》安装完成

===============================================================================================

4、安装PyYAML。

http://pyyaml.org/wiki/PyYAML

  -》Download and Installation-》Windows installers:

  -》http://pyyaml.org/download/pyyaml/PyYAML-3.10.win32-py2.7.exe (for Python 2.7)

  -》双击运行

 -》完成。

===============================================================================================

5、NLTK数据源下载。

  -》在python IDLE中键入:

   >>> import  nltk

   >>> nltk.download()

   会输出:showing info http://nltk.github.com/nltk_data/

   并出现图:

 -》选择book,设定好下载路径Download Directory(例如设定D:\nltk_data)。

    然后点击Download,系统就开始下载NLTK的数据包了,下载的时间比较漫长,大家要耐心等待。

-》期间可能会出现数据包无法下载的情况,如图:

-》选择Cancel,打开D:\nltk_data\corpora下删除对应数据包,然后双击重新开始即可。

-》或者也可以到NLTK Corpora:http://nltk.org/nltk_data/ 来手动下载。

    这个页面下的文档就是上图包含的所有的内容

 -》下载数据完成。

===============================================================================================

6、来一个简单的nltk功能小测试

   输入:from nltk.book import  *

   >>> from nltk.book import  *

   输出:

*** Introductory Examples for the NLTK Book ***

Loading text1, ..., text9 and sent1, ..., sent9

Type the name of the text or sentence to view it.

Type: 'texts()' or 'sents()' to list the materials.

text1: Moby Dick by Herman Melville 1851

text2: Sense and Sensibility by Jane Austen 1811

text3: The Book of Genesis

text4: Inaugural Address Corpus

text5: Chat Corpus

text6: Monty Python and the Holy Grail

text7: Wall Street Journal

text8: Personals Corpus

text9: The Man Who Was Thursday by G . K . Chesterton 1908

===============================================================================================

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏iOSDevLog

Docker Cheat Sheet

“使用Docker,开发人员可以使用任何工具链以任何语言构建任何应用程序。”Dockerized“应用程序完全可移植,可以在任何地方运行 - 同事的OS X和W...

782
来自专栏开源项目

码云推荐 | 文件/文件夹备份工具 FilesBackuper

作者语 一个简单实用没有UI的文件/文件夹备份工具,支持全量、差异、增量备份模式。 ? 项目介绍 ? FileBackuper 是一个简单的无UI文件/文件夹复...

3729
来自专栏云计算教程系列

如何使用CentOS 7上的CloudFlare验证来检索让我们加密SSL通配符证书

Let's Encrypt是一个证书颁发机构(CA),它为传输层安全性(TLS)加密供免费证书。它提供了一个名为Certbot的软件客户端,它简化了证书创建,验...

762
来自专栏小狼的世界

Centos 下同时安装 Mysql4 和 Mysql5,二进制方式

系统中原有 Mysql4 ,但是需要使用 Mysql5 的一些新特性,但是 Mysql4 又不能够删除,所以需要同时安装两个版本的 Mysql。

704
来自专栏技术专栏

慕课网Spark SQL日志分析 - 2.Spark 实战环境搭建

下载地址: http://spark.apache.org/downloads.html

1011
来自专栏PHP技术

开始使用PHPUnit

想试一下单元测试很久了,但是一直没有合适的项目,而且中文网络上的PHPUnit教程要么太旧,要么太乱,所以总也没学会。最近准备把手头的项目重构一下,决定开始使用...

1013
来自专栏ChaMd5安全团队

MHN中心服务器搭建与树莓派蜜罐部署

MHN中心服务器搭建 ? 0x00 介绍 MHN(Modern Honey Network),是一个用于管理和收集蜜罐数据的中心服务器。通过MHN,可以实现快...

4267
来自专栏源码之家

使用php-js-ext在PHP内解析javascript脚本

1967
来自专栏张戈的专栏

Linux中的完美截图工具:Deepin-ScreenShot

 跟了我 5 年多的本本已步入花甲,CPU 严重老化,运行 Windows 异常吃力,于是考虑换成 Linux 试试。忙活了一天,测试了 2 个“家用”Linu...

3955
来自专栏散尽浮华

Linux下误删除后的恢复操作(ext3/ext4)

Linux是作为一个多用户、多任务的操作系统,文件一旦被删除是难以恢复的。尽管删除命令只是在文件节点中作删除标记,并不真正清除文件内容,但是其他用户和一些有写盘...

2997

扫码关注云+社区