首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >手把手教你从零搭建Python数据分析环境

手把手教你从零搭建Python数据分析环境

作者头像
用户1154259
发布2018-01-17 10:17:01
1.2K0
发布2018-01-17 10:17:01
举报

由于最近再做推荐系统的特征处理,需要借助一些工具来筛选特征。最初使用了R,R的安装很简单,而且API也很容易使用,直接就能出图。后来,发现很多人在python和R之间做选择,所以我也在两个工具间摇摆不定。后来,发现Tensorflow里面有很多python的代码,而且python可以做爬虫写web,几乎是万金油的角色。本着想找一门以后日常使用的工具的心态,最终还是选择了python。

那么本篇就从下面几个方面介绍下,如何在日常使用python做数据分析:

  • python安装以及numpy、matplotlib的安装
  • python的hello world
  • SublimeText的python集成
  • 相关推荐

希望对那些刚刚打算做数据分析的朋友,提供参考。

Python以及必要的库安装

Python目前有两个版本,一个是2.7,一个是3.4,在同事的推荐下,选择了2.7。Python的下载直接去官网就可以了,但是想要做数据分析,还需要依赖很多其他的模块,比如科学计算库Numpy,图形库matplotlib,数值计算库scipy,数据挖掘分析库pandas,本篇就先安装个Numpy和matplotlib,以做演示,其他库的安装基本类似。

python安装的几种方式
  • 一种是在sourceforge上下载exe文件,只要操作系统版本没问题,几乎是一键安装
  • 一种是下载zip或者tar.gz压缩包,使用里面的setup.py执行setup.py install命令安装
  • 另一种是下载whl文件,放在python的scripts文件夹中,使用命令pip install xxx.whl安装

我这次由于需要的库比较多,下载的安装文件什么样子都有,所以几种方式都会演示下。

相关的下载资源参考分享链接:链接:http://pan.baidu.com/s/1i4Jhez7 密码:t1sw

安装Python

直接运行python-2.7.13.amd64.msi,无脑下一步即可,不过要记住python所在的目录C:\Python27\,稍后需要对这个目录进行添加文件。

安装numpy和matplotlib

如果版本没问题(比如不是64位系统下载安装32位软件),那么会自动识别到python所在的目录,直接下一步安装即可。

Matplotlib也是一样安装即可。

安装cycler、dateutil

把whl文件拷贝到python27/scripts目录下,可以暂时忽略requests那个文件,这个requests库是webhdfs库连接hdfs环境用的,如果不使用可以用安装

然后分别执行命令:

pip install cycler-0.10.0-py2.py3-none-any.whl
pip install python_dateutil-2.6.1-py2.py3-none-any.whl
安装pyparsing

解压pyparsing压缩包,在setup.py那层目录执行setup.py install命令安装即可

安装到这里,numpy和matplotlib就可以使用了~

python初体验

python安装完,来体验一下吧。python支持控制台输出,也支持在新的文件中写入多行内容,统一执行。

SublimeText集成

直接使用IDLE,有点太麻烦,直接基于sublime text开发过ruby和web前端,体验非常好,所以还是想通过sublimeText编写python代码。

因此首先在点击Tools->Build System->New Build System,弹出文件: { "shell_cmd": "make" }

按照下面的配置输入: { "cmd": ["C:/Python27/python.exe", "-u", "$file"], "file_regex": "^[ ]File "(…?)", line ([0-9]*)", "selector": "source.python" } 并保存成自己的名字(我起名叫做my_python),注意路径需要修改为本地的python路径。路径为C:\Users\xxh\AppData\Roaming\Sublime Text 3\Packages\User

在Tools -> Build System 中重新选择my_pyhton

然后再SublimeText中体验一下matplotlib的魅力,代码如下:

import numpy as np
import matplotlib.pyplot as plt
plt.figure(1)
ax1=plt.subplot(211)
x=np.linspace(0,100,100)
for i in xrange(1,100):
    plt.figure(1)
    plt.plot(x,x*2)
plt.show()

按ctrl+B即可执行:

相关推荐

1 廖雪峰的python教程:http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/ 2 runoob的python教程:http://www.runoob.com/python/python-tutorial.html

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2017-07-13 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Python以及必要的库安装
    • python安装的几种方式
      • 安装Python
        • 安装numpy和matplotlib
          • 安装cycler、dateutil
            • 安装pyparsing
            • python初体验
            • SublimeText集成
            • 相关推荐
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档