首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python开发环境Aptana studio 3安装使用说明

为图方便,直接从国内拷贝了Aptana Studio 3 Workspace,但在安装过程中还是出现一些问题,如弹出“failed to correctly acquire intaller_nodejs_windows.msi file: CRC error”等,由于之前的安装过程印象模糊,只能重新开始。现将安装过程整理如下,一方面分享给大家,也为自己下次安装少走弯路。

运行Aptana需要Node.js、Git和JDK的配合,其中Node.js和Git根据电脑情况选择x86 32bit或x64 64bit,JDK必须选择32位。三个的下载地址如下:

Node.js:https://nodejs.org/en/;

Git:https://git-scm.com/;

JDK:https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

安装好Aptana之后,还需要配置Aptana的默认编辑器,修改首选项preferences中的Interpreters,例如使用Python,需要修改Python Interpreter的Location,只需点击Quick Auto-Config即可完成,否则如果默认的编辑器目录不匹配会报错。

下一步是Aptana的汉化及相关插件的安装,通过帮助—安装新软件,点击添加(Add),会弹出Add Repository,填写名称和位置即可自动安装,简单介绍一下汉化软件和PyDev的安装链接。

其中:Babel p2,https://www.eclipse.org/babel/downloads.php;

PyDev:Pydev,http://pydev.org/updates。

至此,Aptana的安装基本就完成了,剩下就是启动从国内带过来的PyDev Package,主要是安装一些python扩展程序库,由于涉及词组分析和词云图生成,需要安装jieba、numpy、PIL、wordcloud、matplotlib等,下面一一介绍。

1、jieba分词工具,中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块,在进行中文自然语言处理时,通常需要先进行分词。本文详细介绍现在非常流行的且开源的分词器结巴jieba分词器,并使用python实战介绍。jieba分词算法使用了基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能生成词情况所构成的有向无环图(DAG), 再采用了动态规划查找最大概率路径,找出基于词频的最大切分组合,对于未登录词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法(神奇的维特比算法)。jieba分词支持三种分词模式:A. 精确模式, 试图将句子最精确地切开,适合文本分析;B. 全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;C. 搜索引擎模式,在精确模式的基础上,对长词再词切分,提高召回率,适合用于搜索引擎分词。https://pypi.org/project/jieba/,下载后通过cmd进入目录后,通过python setup.py install命令安装。

2、NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:一个强大的N维数组对象 ndarray、广播功能函数、整合 C/C++/Fortran 代码的工具、线性代数、傅里叶变换、随机数生成等功能,http://www.numpy.org/。

3、PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了。 PIL历史悠久,原来是只支持python2.x的版本的,后来出现了移植到python3的库pillow,pillow号称是friendly fork for PIL,其功能和PIL差不多,但是支持python3。

https://www.lfd.uci.edu/~gohlke/pythonlibs/#pillow

4、词云以词语为基本单位,更加直观和艺术的展示文本。wordcloud库把词云当作一个WordCloud对象,wordcloud.WordCloud()代表一个文本对应的词云,可以根据文本中词语出现的频率等参数绘制词云。

https://pypi.org/project/wordcloud/

5、Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形 。通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。

安装好上述扩展程序库,代码就可以跑起来了,最后分享一下通过《2018 Department of Defense National Defense Strategy》生成的词云图。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190208G02F9N00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券