windows环境下搭建python+nltk开发环境

nltk(Natural Language Tookit)实际上是python的一个开发包。对于自然语言处理任务非常有用。

===============================================================================================

NLTK 2.0官网http://nltk.org/install.html

===============================================================================================

在windows 32-bit 下的安装步骤如下:

1、Install Python

2、Install Numpy (optional)

3、Install NLTK

4、Install PyYAML

5、Test installation: Start>Python27, then type import nltk

===============================================================================================

1、首先,安装python 2.7

  详见http://blog.sina.com.cn/s/blog_8af1069601019opa.html

===============================================================================================

2、安装Numpy(可选操作)

http://sourceforge.net/projects/numpy/files/NumPy/1.6.2/numpy-1.6.2-win32-superpack-python2.7.exe/download

  -》直接下载

  -》双击运行,下一步下一步点击。

 -》安装完成。

===============================================================================================

3、安装NLTK。

  https://pypi.python.org/pypi/nltk/2.0.4

  -》nltk-2.0.4.win32.exe (md5)(Python 2.5 or higher)

  -》双击运行,一次点击下一步

 -》安装完成

===============================================================================================

4、安装PyYAML。

http://pyyaml.org/wiki/PyYAML

  -》Download and Installation-》Windows installers:

  -》http://pyyaml.org/download/pyyaml/PyYAML-3.10.win32-py2.7.exe (for Python 2.7)

  -》双击运行

 -》完成。

===============================================================================================

5、NLTK数据源下载。

  -》在python IDLE中键入:

   >>> import  nltk

   >>> nltk.download()

   会输出:showing info http://nltk.github.com/nltk_data/

   并出现图:

 -》选择book,设定好下载路径Download Directory(例如设定D:\nltk_data)。

    然后点击Download,系统就开始下载NLTK的数据包了,下载的时间比较漫长,大家要耐心等待。

-》期间可能会出现数据包无法下载的情况,如图:

-》选择Cancel,打开D:\nltk_data\corpora下删除对应数据包,然后双击重新开始即可。

-》或者也可以到NLTK Corpora:http://nltk.org/nltk_data/ 来手动下载。

    这个页面下的文档就是上图包含的所有的内容

 -》下载数据完成。

===============================================================================================

6、来一个简单的nltk功能小测试

   输入:from nltk.book import  *

   >>> from nltk.book import  *

   输出:

*** Introductory Examples for the NLTK Book ***

Loading text1, ..., text9 and sent1, ..., sent9

Type the name of the text or sentence to view it.

Type: 'texts()' or 'sents()' to list the materials.

text1: Moby Dick by Herman Melville 1851

text2: Sense and Sensibility by Jane Austen 1811

text3: The Book of Genesis

text4: Inaugural Address Corpus

text5: Chat Corpus

text6: Monty Python and the Holy Grail

text7: Wall Street Journal

text8: Personals Corpus

text9: The Man Who Was Thursday by G . K . Chesterton 1908

===============================================================================================

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏猿天地

spring boot中自定义错误提示页面

当程序出错的时候,比如500错误,当用户输入的url错误时会找不到网页。 在这种情况下如果用默认的错误页面非常不友好。 一般我们都需要定制一些错误的页面。 在普...

3329
来自专栏菩提树下的杨过

动软.net代码生成器 win2008 r2下无法连接oracle,以及vs2008模板丢失的解决

一天之内遇到了二个奇怪的问题,人品值最近有所下降啊。 1、动软.Net代码生成器(就是园子里李天平的大作) 在win2008 r2下无法连接oracle数据库,...

1825
来自专栏我的博客

Nginx+Apache

1、配置EPEL YUM源 rpm -ivh http://mirrors.yun-idc.com/epel/6/x86_64/epel-release-6-...

3176
来自专栏pangguoming

使用AndroidStudio编译NDK的方法及错误解决方案

参考资料: 【android ndk】macos环境下Android Studio中利用gradle编译jni模块及配置:http://demo.netfouc...

42812
来自专栏游戏开发那些事

【UE4游戏开发】安装UE4时报SU-PQR1603错误的解决方法

  马三在开发过程中一直用的都是UE4.9版本(很久没有更新了。),因为功能都够用,所以也懒得去更新。这不最近UE4 发布了最新的4.14版本,本来想尝个鲜,试...

613
来自专栏Hadoop实操

CDH高可用集群误删NameNode故障恢复

在已启用HA的CDH集群中,误删Standby Namenode服务,导致集群异常,无法再次通过CM启用HA。异常如下

50610
来自专栏我就是马云飞

Android Studio 3.2新功能特性

1721
来自专栏Seebug漏洞平台

Struts2 REST 插件 XStream 远程代码执行漏洞 S2-052(CVE-2017-9805)

漏 洞 概 述 1. 漏洞信息: 2017年9月5日,Apache Struts 发布最新安全公告。Apache Struts2 的 REST 插件存在远程...

2586
来自专栏专注于主流技术和业务

Selenium在Windows7上的系统搭建

Selenium自动化浏览器。就是这样!你用那种方式做什么完全取决于你自己。首先,它是为了测试目的自动化web应用程序,但肯定不限于此。无聊的基于web的管理任...

842
来自专栏木制robot技术杂谈

Hexo搭建个人博客(三)—— Hexo博客的美化

通过前两节的学习,我们已经搭建好自己的博客,就像盖房子一样要对内部进行装修,也就是对博客进行美化。 ---- 安装Hexo博客主题 Hexo博客可以安装不同的...

6469

扫描关注云+社区