小白学数据之新年计划 | 开始学Python吧!

大数据文摘作品,转载要求见文末

作者|张远园

审校|Aileen

Selene对本文亦有贡献

在数据科学家炙手可今天,Python无疑是当今数据科学家最重要的工具之一。新年伊始,如果想进入数据科学家这个领域,那么开始学习Python应当成为你的新年计划之一。本文介绍3步零基础快速入门Python的途步骤,包裹常用的Python安装办法。

新春快乐!作为数据领域的小白,新的一年有什么计划?

小白:新年新气象,我对数据行业一直很有兴趣,我很想今年里更好的准备自己进入这个行业,却不知如何下手。

小白你知道大数据领域什么职位最赚钱?当然是数据科学家数据科学家数据科学家!重要的事情一定要说三遍。

小白:你说赚钱就赚钱?我不信!

答:OK。请参考大数据文摘2015-12-21文章《数据科学行业的8个关键角色:职责与技能》。我们用数据说话!

小白:哇!太壕!我要做数据科学家!快告诉我怎样才能成为数据科学家?!

答:同样请参考大数据文摘2015-12-21文章《数据科学行业的8个关键角色:职责与技能》。作为数据科学行业收入最高的人之一,数据科学家需要会利用最新的科技手段处理原始数据,进行必要的分析,并以一种信息化的方式将获得的知识展示给他的同事。数据科学家可能来自各种各样的背景,但是因为需要分析大量的数据,所以编程技能是必须的。

小白:额,做个数据科学家,要学这么多语言,我看我还是放弃吧…

答:别啊,其实不需要学这么多…

小白:所以?

答:虽然掌握多种语言会非常有用,但只是在需要的时候这样。我们选择使用同一种语言应用在大部分的项目中,这样数据科学家们就可以在项目中进行合作;而被选择的这个语言,一定是非常易学的!

小白:所以这个语言究竟是什么嘛!急死我了!

答:Python。借助开源社区的支持,Python已经成为了数据科学方面的有力工具。Python具有简单易学的语法,强大的数据处理能力以及可怕的开源数据库,如Numpy、Pandas、 Scikit-learn和Statsmodels;所有的这些可以让Python既能做探索性分析,又可以构建可扩展大数据管道和机器学习算法。只有针对一些非常规的模型,我们有时会结合Python和R来进行处理,用Python来做繁重的数据处理,用R做统计建模。

小白:这么好!只要学一种语言!那应该怎么学呢?

答:我相信,最好的学习方法一定是“做中学”。市面上有太多Python学习的书,网上也有各种Python学习网站,但我强烈向初学者推荐Codecademy的Python课程(https://www.codecademy.com/learn/python)。Codecademy向访问者提供了一个可交互的网页,来访者可以直接在网页上进行Python语言练习,练习结果、进程也可以被准确追踪。所以,即使不安装软件也是可以在网页上直接联系的啦!相似可以在网页上学习Python的课程还有很多,如密歇根大学在Coursera上的Python for Everybody专题(https://www.coursera.org/specializations/python)。

小白:真的是好兴奋!所以学完Python课程以后,我也不用安装软件、可以直接在Codecademy或者Coursera上编码实现的啦!

答:并不是这样的!课程学习完之后,我们就需要在我们自己的电脑上安装Python,来编程实现自己的工程啦。Python是开源的,可以免费从官方网页上进行下载。

下载Python:

◇登录https://www.python.org/downloads/windows/;

◇点击Latest Python 3 Release - Python 3.6.0

◇滚动到页面底部Files表格,找到Windows x86 executable installer,如果想下载其它版本也是可以的;

◇双击exe文件,根据屏幕指示进行操作。如果对设置不确定,选择默认值,因为所有的设置都可以在后期进行修改;

◇你会注意到,安装过程中会弹出一个命令提示窗口并安装Pip(Pip是一个库管理工具)。Pip可以让你通过PiPI(Python Package Index)下载任何Python库;

◇现在可以通过终端或者IDLE来进行Python编程。只需要在电脑程序里搜索Python,打开IDE或者命令行来执行一行代码。

不过呢,这个网页上的官方版本只包含了标准的Python库。标准的Python库并没有复杂到可以完成所有的数据科学分析;但幸运的是开源社区里有着强大的库,足以支撑Python做数据科学。

小白:所以我得去官方网页下载Python,还得去开源社区下载各种库啊,有没有办法一次就把想要的都下载了呢?

答:还真的就有!而且有两种方法!

方法一(推荐方法):

开始Python的最快捷方法是下载免费应用Rodeo。这个应用除了提供可供Python编码和执行的文本编辑器之外,还会提供历史操作、文件导航、画图等功能选项。

Python是Rodeo的一部分,安装Rodeo后无需额外步骤就可以直接使用Python。

如何下载Rodeo:

◇ 登录网页https://www.yhat.com/products/rodeo;

◇ 点击蓝色的DOWNLOAD按钮,或者可以在下面的两行中选择自己需要的平台版本;

◇ 一个后缀名为.exe的文件开始下载;

◇ 双击下载的.exe文件,根据屏幕指示进行操作。如果对设置不确定,选择默认值,因为所有的设置都可以在后期进行修改;

◇ 执行完以上操作后,Rodeo会自动打开。Python已经安装在里面,可以直接在左上的编辑窗口里进行编程!

方法二:

Anaconda包含了许多最通用的数据库供使用(共150个,另有250个可以使用conda install命令进行安装)。

跟Rodeo不同的是,当下载Anaconda时,并没有得到一个可供Python数据挖掘和分析的“环境”(IDE环境,是指交互开发环境)。

如何下载Anaconda(包含Python):

◇ 登录网页https://www.continuum.io/downloads;

◇ 点击绿色的“64-bit Installer”按钮;

◇ 一个后缀名为.exe的文件开始下载;

◇ 双击下载的.exe文件,根据屏幕指示进行操作。如果对设置不确定,选择默认值,因为所有的设置都可以在后期进行修改;

◇ 执行完以上操作后,一个新终端窗口会打开;如果没有新窗口,点击Start -> Run -> Command -> Prompt;

◇ 可以开始在终端窗口中写代码啦!

小白:嗯,我会安装了。那之后就要开始写代码了吗?之前都只是在Codecademy网页上操作,现在我该怎么在PC上写代码呢?

答:只需要打开记事本,写下你的Python代码(地址C:\Users\thom\new_file.py),打开cmd命令行窗口,运行自己才写好的Python文件:python C:\Users\thom\new_file.py

小白:这好像也不简单哎……

答:你真是会来事啊,不过我们真的有解决之道噢。为了能有一个更美好的Python生活,我们可以在Pycharm(https://www.jetbrains.com/pycharm/?fromMenu)中进行开发。Pycharm是一种集成开发环境,可以支持分开发者在所提供的环境中进行开发。只需要点击开发环境中的“run script”按钮就可以运行程序。同时,该集成开发环境还可以让数据科学家们更高效,因为它提供了自动填充以及运行中错误检查的功能。如果你忘了一个空格或者用了一个已经被定义的函数名称,它会自动提醒你;他还可以帮你插入Git之类的版本控制系统。(很多人都认为这是最好用的Python IDE, 如果你熟悉R语言的话,Pycharm就类似Rstudio)

小白:哇偶,好像真的很简单哎!

答:是啊!非常迅速地,你就可以开始你的数据科学家之路啦!万事开头难 --你只要选择一个Python从零开始的课程,按部就班的学下去,跟着提供的作业做练习,不出几个月就可以学会Python最主要的技巧了。装好了Python,接下来,如果想要更深入学习网课之外的内容,可以选择《利用Python进行数据分析》这样的教材类型书籍。

其实各类教程和书籍都是大同小异的,选择哪个区划没有那么大。

小白:嗯!最重要的是选择一个然后坚持下去!从零开始变成Python小能手就是我的2017新年计划啦,我这就去开始了!

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2017-01-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏斑斓

可视化与领域驱动设计

从DDD的角度,领域逻辑的分析可以运用战略方法Bounded Context。可是,一个问题是:如何获得Bounded Context ? 我查看了许多关于Bo...

40790
来自专栏知晓程序

小程序插件审核又没过?教你避开这几个坑 | 开发

18120
来自专栏企鹅号快讯

UI前端同学回来抢经验,react native开发实战五部曲的实战与锤炼,咬牙学完保证变大牛!

背景 现在很多移动项目全都专项纯rn开发,对于rn的应用趋势不言而喻,学习一些rn的语法并不是十分困难,但是如何在项目中灵活运用,增加实战项目经验,这还是比较困...

49560
来自专栏花叔的专栏

小程序支持跳转网页会带来什么影响

11月2日,iphone X 发售的前一晚,微信小程序发布了一个重量级的更新: 小程序内嵌网页能力开发 使用教程很简单: 到mp.weixin.qq.com登录...

749120
来自专栏用户2442861的专栏

前端工程——基础篇

https://github.com/fouber/blog/issues/10#issuecomment-271133674

11020
来自专栏编程微刊

做前端技术方案选型的时候,你是怎么做决策的?

最近在知乎上看到的一个提问做前端技术方案选型的时候,你是怎么做决策的?想起一年来自己所做的项目,全都是一个人在做选型,能力也在一步步中培养起来。

16410
来自专栏罗超频道

记住微信这个特殊功能,关键时刻将派上大用场

前些天,我的iPhone出现了卡顿现象,在使用微信时,总提示存储空间不够,必须清理。去设置里面查了一下,发现微信“吃”掉了大部分存储空间,高达几个GB,而我的手...

50770
来自专栏服务端技术杂谈

聊聊Web App、Hybrid App与Native App的设计差异

目前主流应用程序大体分为三类:Web App、Hybrid App、 Native App。 ? 一、Web App、Hybrid App、Native App...

36780
来自专栏ytkah

微信公众平台多客服新增自定义客服头像和消息转发接口功能

  多客服一般是开放给微信认证服务号的一个便捷功能,可以将消息转发到多客服方便回复。对有些“选择综合症“的客服,看到那一层不变的客服头像就想吐槽。现在好了,多客...

73940
来自专栏顶级程序员

2016年你应该学习的语言和框架

2015年,软件开发界发生了很多变化。有很多流行的新语言发布了,也有很多重要的框架和工具发布了新版本。下面有一个我们觉得最重要的简短清单,同时也有我们觉得值得你...

398140

扫码关注云+社区

领取腾讯云代金券