统计师的Python日记【第1天:谁来给我讲讲Python?】

统计师的Python日记

【第一天】谁来给我讲讲Python?

我是一名数据分析师,曾在漫长的岁月中使用SAS、Matlab和R(使用频率依次递减)。其他如SPSS、STATA、Eviews也都是必备的基本技能。或许是网上嘈嘈杂杂的关于大数据、互联网的新形势争论,或许是招聘网站上越来越多的技能需求,让我在某一天突然想学点Python,是的需要学点Python了,虽然我现在不知道它能干什么。

“谁来给我讲讲Python?”

作为无基础的初学者,只想先大概了解一下Python,随便编个小程序,并能看懂一般的程序,那些什么JAVA啊、C啊、继承啊、异常啊通通不懂,于是我找了很多资料,并过滤掉了对我这个阶段而言的无用信息,写成下面这篇日记,以完全初学者的角度入手,里面有我学习过程中提出的一些疑问,和我找到答案,简单、清晰。

今天的学习大纲如下:

一、为什么学Python?

二、安装与熟悉

1、安装

2、熟悉

三、容器

1、什么是容器

2、序列的一些通用操作

3、列表操作

4、字符串操作

5、字典操作

日记小结

一、为什么学Python?

在搜索Python相关用处的时候,看到一些帖子讨论,坚定了我学习Python的决定:

知乎网友张博:

“楼主不知道知乎就是用Python做支撑的么?”

知乎网友吴畅:

“Python会提高程序员的审美标准。”

外刊IT评论:

“跟C/C++/Java相比 — Python/Ruby能让你用少的多的多的代码写出相同的程序。”

人大经济论坛网友“zxn2011”:

“在纽约做了一年多的数据的dataanalyst,基本上已经抛弃MATLAB,95%的工作都是用python和R和sas完成。”

“你学matlab不是也要学编程吗?既然都是编程,为什么不学一个彻底的编程语言呢。而且今后和CTP等交易平台对接的话,matlab就无能为力了,到时候再学python岂不是晚了。”

(注:据笔者后来了解,matlab似乎也是可以与CTP平台对接的。)

Bruce Eckel:Life is short, you need Python. 人生苦短,我用Python。

…...

还有很多,不管怎样,作为一名偏向经济、金融的统计分析人员,想与杀入自己领域的IT码农们争一方天下,Python是个捷径。因此,今天,我开始学习Python!

二、安装与熟悉

1. 安装

去这里下载Python并安装https://www.python.org/download/,我装了2.7.7,并去这里下载一些扩展模块http://www.lfd.uci.edu/~gohlke/pythonlibs,各种模块,无论是32位还是64位,应有尽有。这里先下载Numpy,对应我电脑32位的,版本2.7的,如果不知道自己电脑室32位还是64位,那就都下下来,到时候哪个安装成功,就说明适合那个。

下载安装之后,打开pythonshell,在这个界面就可以使用python了。

2. 熟悉

在正式介绍python之前,了解下面两个基本操作对后面的学习是有好处的:

(1)基本的输入输出

可以在Python中使用+、-、*、/直接进行四则运算。

————————————

>>>1+3*3

10

————————————

也可以用print语句来显示

————————————

>>>print1+3*3

10

————————————

输入字符,可以用双引号或者单引号:

————————————

>>>print"hello"

hello

>>>print'hello'

hello

————————————

在字符串的输入中,为了便于阅读,想要换行再输,可以使用反斜线:

————————————

>>>print "abc\

ABC"

abcABC

————————————

这个时候我有了一个疑问:

“如果不是为了易读,这个字符串本身就是要换行该怎么办?”

答案是使用三个双引号把内容给括住:

————————————

>>>print """abc

ABC"""

abc

ABC

————————————

(2)导入模块

使用import可以导入模块,导入之后,就可以使用这个模块下面的函数了。

比如导入math模块,然后使用math模块下面的sqrt函数:

————————————

>>>importmath

>>>math.sqrt(9)

3.0

————————————

这时我有疑问了:

“每次引用函数的时候,math这个模块前缀都要带吗?可不可以不带?”

直接输入sqrt(9)是会报错的,好烦人,那么有什么办法可以不用每次都带前缀?办法是有的,用“from 模块 import 函数”的格式先把函数给“拿”出来。

————————————

>>>from math import sqrt

>>>sqrt(9)

3.0

————————————

这样每次使用sqrt函数的时候就不用再加math前缀了。当我正准备跳过的时候,又有了一个问题?

“math模块下面有那么多函数,可不可以写一个语句,然后math下面所有函数都可以直接使用?”

调用了math下面的sqrt函数,写一个from…import…,再调用下面的floor,还要写一个,如此也挺麻烦的,有个办法可以一下把所有函数都给“拿”出来:

——————————————

>>>from math import *

>>>sqrt(9)

3

>>>floor(32.9)

32.0

——————————————

当然,后来我了解到,应该尽量避免使用from…import…而使用import语句⊙﹏⊙,因为这样可以更加易读,也可以避免冲突。

三、容器

1、什么是容器

开始学Python时,被它的数据结构,什么字典、序列、元组等等搞的很混乱,估计有跟我一样的初学者,所以我梳理了一下留存:

首先要从容器说起,Python中有一种名为容器的数据结构,顾名思义,容器,就是装数据的器具,它主要包括序列和词典,其中序列又主要包括列表、元组、字符串等(见下面那张图)。

  • 列表的基本形式比如:[1,3,6,10]或者[‘yes’,’no’,’OK’]
  • 元组的基本形式比如:(1,3,6,10)或者(‘yes’,’no’,’OK’)
  • 字符串的基本形式比如:’hello’

以上几种属于序列,序列中的每一个元素都被分配一个序号——即元素的位置,也称为“索引”,第一个索引,即第一个元素的位置是0,第二个是1,依次类推。列表和元组的区别主要在于,列表可以修改,而元组不能(注意列表用中括号而元组用括号)。序列的这个特点,使得我们可以利用索引来访问序列中的某个或某几个元素,比如:

——————————————

>>>a=[1,3,6,10]

>>>a[2]

6

>>>b=(1,3,6,10)

>>>b[2]

6

>>>c=’hello’

>>>c[0:3]

‘hel’

——————————————

而与序列对应的“字典”则不一样,它是一个无序的容器,

  • 它的基本形式比如:d={7:'seven',8:'eight',9:'nine'}

这是一个“键—值”映射的结构,因此字典不能通过索引来访问其中的元素,而要根据键来访问其中的元素:

——————————————

>>>d={7:'seven',8:'eight',9:'nine'}

>>>d[8]

'eight'

——————————————

2、序列的一些通用操作

除了上面说到的索引,列表、元组、字符串等这些序列还有一些共同的操作。

(1)索引(补充上面)

序列的最后一个元素的索引,也可以是-1,倒数第二个也可以用-2,依次类推:

——————————————

>>>a=[1,3,6,10]

>>>a[3]

10

>>>a[-1]

10

——————————————

(2)分片

使用分片操作来访问一定范围内的元素,它的格式为:

  • a[开始索引:结束索引:步长]

那么访问的是,从开始索引号的那个元素,到结束索引号-1的那个元素,每间隔步长个元素访问一次,步长可以忽略,默认步长为1。

——————————————

>>>c=’hello’

>>>c[0:3]

‘hel’

>>>c[0:4:2]

‘hl’

——————————————

这个就好像把一个序列给分成几片几片的,所以叫做“分片”

(3)序列相加

即两种序列合并在一起,

——————————————

>>>[1,2,3]+[4,5,6]

[1,2,3,4,5,6]

>>>‘hello,’+’world!’

‘hello,world!’

——————————————

两种相同类型的序列才能相加

(4)乘法

即序列可以被重复n次

——————————————

>>>’hello’*5

‘hellohellohellohellohello’

——————————————

(5)成员资格

为了检查一个值是否在序列中,可以用in运算符

——————————————

>>> 'o' in a

True

>>> 't' in a

False

——————————————

下面可以用这张表回忆一下几个操作分别是干嘛的:

回忆

解释

备注

索引是干嘛的?

序列中列表的位置

第一个从0开始,最后一个索引号可以用-1表示

分片是干嘛的?

把序列分成一片一片

也就是访问序列中一定范围内的元素

序列相加是干嘛的?

两个序列的合并

乘法是干嘛的?

序列重复n遍

成员资格是干嘛的?

检查某个元素是否在序列中

在则返回true,否则false

3、列表操作

以上是序列共有的一些操作,列表也有一些自己独有的操作,这是其他序列所没有的

(1)List函数

可以通过list(序列)函数把一个序列转换成一个列表:

——————————————

>>> list(‘hello’)

[‘h’,’e’,’l’,’l’,’o’]

——————————————

(2)元素赋值、删除

元素删除——del a[索引号]

元素赋值——a[索引号]=值

——————————————

>>> a

'hello'

>>> b=list(a)

>>> b

['h', 'e', 'l', 'l', 'o']

>>> del b[2]

>>> b

['h', 'e', 'l', 'o']

>>> b[2]='t'

>>> b

['h', 'e', 't', 'o']

——————————————

分片赋值——a[开始索引号:结束索引号]=list(值)

为列表的某一范围内的元素赋值,即在开始索引号到结束索引号-1的区间几个元素赋值,比如,利用上面语句,如何把hello变成heyyo?

——————————————

>>> b

['h', 'e', 'l', 'l', 'o']

>>> b[2:4]=list('yy')

>>> b

['h', 'e', 'y', 'y', 'o']

——————————————

注意虽然“ll”处于“hello”这个单词的第2、3号索引的位置,但赋值时是用b[2:4]而不是b[2:3],另外注意list()用小括号。

(3)列表方法

上面说过list函数,函数这个东西在很多语言中都有,比如excel里面的if函数、vlookup函数,SQL里面的count函数,以及各种语言中都有的sqrt函数等等,python中也有很多函数。

Python中的方法,是一个“与某些对象有紧密联系的”函数,所以列表方法,就是属于列表的函数,它可以对列表实现一些比较深入的操作,方法这样调用:

对象.方法(参数)

那么列表方法的调用就理所当然是:

列表.方法(参数)

常用的列表方法这么几个,以a=['h','e','l','l','o']为例:

实现功能

方法

给列表a的n索引位置插入一个元素m

a.insert(n,m)

>>>a.insert(2,'t')>>>a>>>['h','e','t','l','l','o']

给列表的最后添加元素m

a.append(m)

>>>a.insert(2,'q')>>>a>>>['h','e','l','l','o','q']

返回a列表中,元素m第一次出现的索引位置

a.index(m)

>>>a.index('e')>>>1

删除a中的第一个m元素

a.remove(m)

>>>b.index('l')>>>b>>>['h','e','l','o']

将列表a反转

a.reverse()

>>>b.reverse()>>>b>>>['o','l','l','e','h']

将列表a从大到小排列

a.sort()

>>>b.sort()>>>b>>>['e','h','l','l','o']

弄这么几个常用的列表方法意思一下,更多的函数可以需要的时候再查,百度一下就OK。

注意如果a不是列表,比如是字符串的话,结果会报错,因为这些方法都是列表方法。

4、字符串操作

(1)字符串转换

字符串转换,主要指是转换字符串的宽度(占多少位)、精度、类型。以前我觉得字符串有什么需要转换的,输入要输入的就好了,其实不然,比如e这个常数,有时候我需要显示具体的数字,有时候保留两位显示,有时候保留5位显示,有时候甚至10位,不可能每次去查,用字符串转换一下就行,一般用如下格式转换:

'%宽度.精度类型'% 要转换的值

比如,现在用这个语句把e分别保留2位、5位、10位小数显示:

——————————————

>>> '%10.2f'%e

' 2.72'

>>> '%10.5f'%e

' 2.71828'

>>> '%10.10f'%e

'2.7182818285'

——————————————

以上的三个例子,都是指定宽度为10,因此不够的空格填补,如果不想有空格怎么办?

  • 不想留空格,直接不填宽度,
  • 宽度之前加0,表示前面的空格将用0填充;
  • 宽度之前加减号-,表示左对齐:

——————————————

>>> '%.2f'%e

'2.72'

>>> '%010.2f'%e

'0000002.72'

>>> '%-10.2f'%e

'2.72 '

——————————————

(2)字符串方法

字符串也有自己的方法,以b='hello'为例:

实现功能

方法

查找字符串a中某个字符元素n的索引号

b.find(n)

>>> b.find('e')1

将列表中的字符串用某符号穿起来

符号.join(列表)

>>>a=['h','e','l','l','o']>>>'+'.join(a)>>>'h+e+l+l+o'

将字符串的所有字母小写

b.lower()

>>>'TT'.lower()>>>'tt'

将字符串的某个字母大写

b.title()

>>> b.title()>>>'Helo'

将字符串b中的n替换成m

b.replace(n,m)

>>> b.replace('h', 'p')>>>'pello'

字符串的方法还有很多,在需要的时候百度之就OK。

5、字典操作

(1)dict函数

dict函数可以通过关键字参数来创建字典,格式为:

dict(参数1=值1,参数2=值2, …)={参数1:值1, 参数2=值2, …}

比如,如何创建一个名字name为jiayounet,年龄age为28的字典?

——————————————

>>> dict(name='jiayounet',age=27)

{'age': 27, 'name': 'jiayounet'}

——————————————

此外,dict函数还可以把下面的序列变成字典形式:

比如某银行想找到最有价值的那个客户,现在经过某个算法从数据库中找到了这个客户,他的信息是这样的:[('name', 'jiayounet'), ('age',27)],该客户名字为jiayounet,年龄是27岁,这个结果很不易读,现在想转化成字典形式呈现:

——————————————

>>> dict( [('name','shushuo'),('age',27)] )

{'age': 27, 'name': 'shushuo'}

——————————————

(2)基本操作

字典的基本行为与列表在很多地方都相似(很多地方说与序列相似,这里还是觉得是与序列中的列表相似,还记得那张图吧),下面的例子以序列a=[1,3,6,10],字典f={'age': 27, 'name': 'shushuo'}为例

功能

列表操作

字典操作

格式

格式

求长度

len(列表)

>>>len(a)4

len(字典)

>>>len(f)2

找到某位置上的值

列表[索引号]

>>>a[1]3

字典[键]

>>>f['age']27

元素赋值

列表[索引]=值

>>>a[2]=1>>>a[1,3,1,10]

字典[键]=值

>>>f['age']=28>>>f{'age': 28, 'name': 'shushuo'}

元素删除

del 列表[索引]

>>>del a[1]>>>a[1,6,10]

del 字典[键]

>>> del f['name']>>> f{'age': 28}

成员资格

元素 in 列表

>>> 1 in aTrue

键 in 字典

>>> 'age' in fTrue

注意成员资格中,是“键in 字典”,查找的是键而不是值。

日记小结:

今天学习了Python的基本页面、操作,以及几种主要的容器类型,天还要学习Python的函数、循环和条件、类,然后才算是对Python有一个大致的了解。

原文发布于微信公众号 - 数说工作室(shushuojun)

原文发表时间:2014-09-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Python爬虫与数据挖掘

Python正则表达式初识(四)

普天同庆的日子里,送出最真的祝福,祝祖国繁荣昌盛,祝朋友事业有成,祝父母身体健康,祝大家永远开心,祝所有人幸福平安~~

693
来自专栏iKcamp

全本 | iKcamp翻译 | 《JavaScript 轻量级函数式编程》|《你不知道的JS》姊妹篇

本书主要探索函数式编程(FP)的核心思想。在此过程中,作者不会执着于使用大量复杂的概念来进行诠释,这也是本书的特别之处。我们在 JavaScript 中应用的仅...

33810
来自专栏鸿的学习笔记

函数式编程阅读笔记

当我们要从一个不可变的list里删除元素或者添加元素怎么办?当增加元素时,你取出来的值的引用就是在原始表中增加元素,而不去修改原来的数据结构。也就是复用。

811
来自专栏用户2442861的专栏

python 中迭代多个序列

http://blog.csdn.net/he_jian1/article/details/40819407

672
来自专栏鸿的学习笔记

从Scala和Python的“shell”说起

在《写给Python和Scala的碎碎念》的系列的开篇,让我们从最简单的交互式“shell”开始,一步步来看看Python和Scala的对于同一件...

1042
来自专栏chenjx85的技术专栏

leetcode-35- Search Insert Position

2193
来自专栏数据结构与算法

P3370 【模板】字符串哈希

题目描述 如题,给定N个字符串(第i个字符串长度为Mi,字符串内包含数字、大小写字母,大小写敏感),请求出N个字符串中共有多少个不同的字符串。 友情提醒:如果真...

2974
来自专栏潇涧技术专栏

Python Data Structures - C2 Sort

参考内容: 1.Problem Solving with Python Chapter5: Search and Sorting online_link ...

881
来自专栏和蔼的张星的图像处理专栏

55. 比较字符串

比较两个字符串A和B,确定A中是否包含B中所有的字符。字符串A和B中的字符都是 大写字母 样例 给出 A = "ABCD" B = "ACD",返回 tru...

1441
来自专栏逸鹏说道

我为NET狂面试题-基础篇-答案

面向过程: 答案:图片只贴核心代码,完整代码请打开解决项目查看 (答案不唯一,官方答案只供参考,若有错误欢迎提出~) 99乘法表 https://githu...

36113

扫码关注云+社区

领取腾讯云代金券