专栏首页开发经验记录windows环境下搭建python+nltk开发环境

windows环境下搭建python+nltk开发环境

nltk(Natural Language Tookit)实际上是python的一个开发包。对于自然语言处理任务非常有用。

===============================================================================================

NLTK 2.0官网http://nltk.org/install.html

===============================================================================================

在windows 32-bit 下的安装步骤如下:

1、Install Python

2、Install Numpy (optional)

3、Install NLTK

4、Install PyYAML

5、Test installation: Start>Python27, then type import nltk

===============================================================================================

1、首先,安装python 2.7

  详见http://blog.sina.com.cn/s/blog_8af1069601019opa.html

===============================================================================================

2、安装Numpy(可选操作)

http://sourceforge.net/projects/numpy/files/NumPy/1.6.2/numpy-1.6.2-win32-superpack-python2.7.exe/download

  -》直接下载

  -》双击运行,下一步下一步点击。

 -》安装完成。

===============================================================================================

3、安装NLTK。

  https://pypi.python.org/pypi/nltk/2.0.4

  -》nltk-2.0.4.win32.exe (md5)(Python 2.5 or higher)

  -》双击运行,一次点击下一步

 -》安装完成

===============================================================================================

4、安装PyYAML。

http://pyyaml.org/wiki/PyYAML

  -》Download and Installation-》Windows installers:

  -》http://pyyaml.org/download/pyyaml/PyYAML-3.10.win32-py2.7.exe (for Python 2.7)

  -》双击运行

 -》完成。

===============================================================================================

5、NLTK数据源下载。

  -》在python IDLE中键入:

   >>> import  nltk

   >>> nltk.download()

   会输出:showing info http://nltk.github.com/nltk_data/

   并出现图:

 -》选择book,设定好下载路径Download Directory(例如设定D:\nltk_data)。

    然后点击Download,系统就开始下载NLTK的数据包了,下载的时间比较漫长,大家要耐心等待。

-》期间可能会出现数据包无法下载的情况,如图:

-》选择Cancel,打开D:\nltk_data\corpora下删除对应数据包,然后双击重新开始即可。

-》或者也可以到NLTK Corpora:http://nltk.org/nltk_data/ 来手动下载。

    这个页面下的文档就是上图包含的所有的内容

 -》下载数据完成。

===============================================================================================

6、来一个简单的nltk功能小测试

   输入:from nltk.book import  *

   >>> from nltk.book import  *

   输出:

*** Introductory Examples for the NLTK Book ***

Loading text1, ..., text9 and sent1, ..., sent9

Type the name of the text or sentence to view it.

Type: 'texts()' or 'sents()' to list the materials.

text1: Moby Dick by Herman Melville 1851

text2: Sense and Sensibility by Jane Austen 1811

text3: The Book of Genesis

text4: Inaugural Address Corpus

text5: Chat Corpus

text6: Monty Python and the Holy Grail

text7: Wall Street Journal

text8: Personals Corpus

text9: The Man Who Was Thursday by G . K . Chesterton 1908

===============================================================================================

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • nginx服务器访问时没解析PHP,直接下载php文件

    在配置服务器的时候,有时候会出现这种情况,将域名映射到目录下,访问该域名却直接下载index.php文件。这种情况该如何解决呢? location ~ \.ph...

    NateHuang
  • SVN增量打包发布步骤

    1.      在svn根目录下show_log进入到日志目录: ? 2.      全选中当前发布版本到上次发布版本如2052-1972: ? 3.     ...

    NateHuang
  • linux设置目录权限命令

    sudo chmod 600 ××× (只有所有者有读和写的权限) sudo chmod 644 ××× (所有者有读和写的权限,组用户只有读的权限) ...

    NateHuang
  • 安装和使用NLTK分词和去停词

    安装NLTK可能出现的问题: 1. pip install ntlk 2. 如果遇到缺少stopwords报错如下:(http://johnlaudun.org...

    MachineLP
  • 初学者|不能不会的NLTK

    本文简绍了NLTK的使用方法,这是一个被称为“使用Python进行计算语言学教学和工作的绝佳工具”。

    yuquanle
  • python进行词性分析

    表示python的nltk包真的很好用,本来想着自己从字典里面抓数据的,后来师兄建议用nltk包,

    py3study
  • 学习笔记CB001:NLTK库、语料库、词概率、双连词、词典

    聊天机器人知识主要是自然语言处理。包括语言分析和理解、语言生成、机器学习、人机对话、信息检索、信息传输与信息存储、文本分类、自动文摘、数学方法、语言资源、系统评...

    利炳根
  • python35下的NLTK工具的安装和配置

    双愚
  • NLP1 —— Python自然语言处理环境搭建

    最近开始研究自然语言处理了,所以准备好好学习一下,就跟着《Python自然语言处理》这本书,边学边整理吧 安装 Mac里面自带了python2.7,所以直...

    用户1154259
  • 学习笔记CB002:词干提取、词性标注、中文切词、文档分类

    英文词干提取器,import nltk,porter = nltk.PorterStemmer(),porter.stem('lying') 。

    利炳根

扫码关注云+社区

领取腾讯云代金券