前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python学习手册之数据类型

Python学习手册之数据类型

作者头像
py3study
发布2020-01-20 11:16:57
1.1K0
发布2020-01-20 11:16:57
举报
文章被收录于专栏:python3python3

 在上一篇文章中,我们介绍了 Python 的异常和文件,现在我们介绍 Python 中的数据类型。

查看上一篇文章请点击:https://www.cnblogs.com/dustman/p/9979931.html

数据类型 None 类型 None 类型是 Python 的特殊类型,它是 NoneType 的对象类型,表示无值。该对象只有一个值 None。其它语言使用 null 来表示这个对象。 它不支持任何运算也没有任何内建方法。作为一个对象其布尔值为 False。除了和自己比较,None 和任何其他的数据类型比较永远返回 False

代码语言:javascript
复制
>>> None == True
False
>>> None
>>> print(None)
None
>>> None == None
True
>>>

如果函数没有清楚地声明返回值,则返回 None 对象。

代码语言:javascript
复制
def func():
 print("I like Python!")
temp = func()
print(temp)

运行结果:

代码语言:javascript
复制
>>>
I like Python!
None
>>>

字典 字典(Dictionaries)是 Python 中一个非常有用的内置数据类型。它不像列表一样通过数字索引来访问,字典当中的元素是通过键来存取。 字典是一个映射类型,在其它语言中被称为 map。字典用 {} 来标识,使用键 : 值 (key : value) 存储,具有极快的查找速度,使用 [] 语法来访问。

代码语言:javascript
复制
sex = {"John":"F","Amy":"M","Echo":"F"}
print(sex["Amy"])
print(sex["John"])

运行结果:

代码语言:javascript
复制
>>>
M
F
>>>

访问不存在字典里的键值会导致 KeyError 异常。

代码语言:javascript
复制
msg = {
 "name":"John",
 "sex":"M",
 "age":10,
}
print(msg["name"])
print(msg["age"])
print(msg["son"])

运行结果:

代码语言:javascript
复制
>>>
John
10

KeyError: 'son'
>>>

实际上字典能够存储任何类型的数据。

代码语言:javascript
复制
字典为空时的表现形式为 {}

只有不可变的对象可以用作字典的 key,不可变的对象是指那些不能更改的对象。到目前为止,我们遇到的唯一可变对象是列表和字典。可变对象做键值会触发 TypeError 异常。

代码语言:javascript
复制
msg = {
 ['a','b','c']:"a to c"
}

运行结果:

代码语言:javascript
复制
>>>
TypeError: unhashable type: 'list'
>>>
代码语言:javascript
复制
正确使用字典非常重要,需要牢记字典的 key 必须是不可变对象。

字典方法

我们知道字典是可变对象,可以像列表一样,字典的键值存储的数值可以重新指派另外的值。

不同于列表的是,我们可以通过字典的键值存储数据,不管这个键存不存在字典里。

代码语言:javascript
复制
msg = {
 "name":"John",
 "sex":"M",
 "age":10,
}
msg[2] = "Home"
msg[8] = "Job"
print(msg)

运行结果:

代码语言:javascript
复制
{'name': 'John', 'sex': 'M', 'age': 10, 2: 'Home', 8: 'Job'}

要在字典里确定一个键是否存在词典里,你可以使用 in 语法。

代码语言:javascript
复制
msg = {
 "name":"John",
 "sex":"M",
 "age":10,
}
print("name" in msg)
print("job" in msg)
print("age" in msg)

运行结果:

代码语言:javascript
复制
>>>
True
False
True
>>>

我们还可以通过 get 的方法从字典里取数据,就像前面用 msg["name"] 这样的方法读取数据。与这种方法不同的是,当字典里没有该键值时 get 方法取回的值是 None,而不会触发 KeyError 异常。

代码语言:javascript
复制
msg = {
 "name":"John",
 "sex":"M",
 "age":10,
 "Job":False,
}
print(msg.get("name"))
print(msg.get(6))
print(msg.get(123,"Not in dictionary!"))

运行结果:

代码语言:javascript
复制
>>>
John
None
Not in dictionary!
>>>
代码语言:javascript
复制
我们还可以指定 get 方法的第二个参数,当键值在字典里不存在是会返回我们所指定的值。

下面代码运行结果是什么?

代码语言:javascript
复制
msg = {
 1:1,2:1,3:2,4:3,
}
print(msg.get(2,0) + msg.get(8,3))

运行结果:

代码语言:javascript
复制
>>>
4
>>>

元组

元组 (Tuples) 跟列表很像,但是元组不能提供列表类能够提供给你的很多功能。元组的一大特征就是不可变。

元组使用圆括号来创建。

代码语言:javascript
复制
msg = ("Hello","World","!",)

你可以像访问列表一样,通过索引来访问元组。

代码语言:javascript
复制
print(msg[1])

给元组的元素重新分配值会触发 TypeError 异常。

代码语言:javascript
复制
msg[0] = "Thank"

运行结果:

代码语言:javascript
复制
>>>
TypeError: 'tuple' object does not support item assignment
>>>
代码语言:javascript
复制
和列表字典一样,元组也能嵌套存储。

我们也可以不用圆括号就创建元组,通过逗号分割来确定元组的分组。

代码语言:javascript
复制
msg = "Hello","World","!"
print(msg[0])

运行结果:

代码语言:javascript
复制
>>>
Hello
>>>

空元祖必须通过圆括号创建。

代码语言:javascript
复制
empty = ()
代码语言:javascript
复制
尽管元组不能改变,但是运行速度快于列表。

列表切片

Python 为列表提供了高级特征切片 (Slice) 操作功能,大大弱化了获取一个列表区间的操作。切片操作通过两个索引数字中间用冒号分割来完成,返回从第一个数字索引到第二个数字索引的一个新列表。

代码语言:javascript
复制
msg = [0,1,2,3,4,5,14,28,32]
print(msg[2:5])
print(msg[0:1])

运行结果:

代码语言:javascript
复制
>>>
[2, 3, 4]
[0]
>>>
代码语言:javascript
复制
和 range 函数操作一样,包含第一个数字索引里的值,不包含第二个数字索引的值。

如果切片的第一个数字忽略,切片操作从 0 开始,如果切片的第二个数字缺失,切片操作直到列表尾部结束。

代码语言:javascript
复制
msg = [0,1,2,3,4,5,14,28,32]
print(msg[:5])
print(msg[5:])

运行结果:

代码语言:javascript
复制
>>>
[0, 1, 2, 3, 4]
[5, 14, 28, 32]
>>>
代码语言:javascript
复制
切片操作同样可以作用于元组。

列表切片操作同样可以提供第三个参数,这一参数将被视为切片的步长 (Step) ,在默认情况下,步长大小为 1、

代码语言:javascript
复制
msg = [0,1,2,3,4,5,14,28,32]
print(msg[:2])
print(msg[2:8:2])

运行结果:

代码语言:javascript
复制
>>>
[0, 1]
[2, 4, 14]
>>>
代码语言:javascript
复制
[2:8:2] 将会取出列表从索引 2 开始直到索引 8 并且每隔 2 个取一个列表的元素。

索引操作也可以使用负数,在这种情况下,位置计数将从列表的末尾开始。

代码语言:javascript
复制
msg = [0,1,2,3,4,5,14,28,32]
print(msg[1:-1])

运行结果:

代码语言:javascript
复制
>>>
[1, 2, 3, 4, 5, 14, 28]
>>>
代码语言:javascript
复制
如果步进使用负值,则切片操作将从后向前执行。

使用 [::-1] 切片是一种常见的方法来反转列表。

列表生成式 列表生成式即 List Comprehensions,是 Python 内置的非常强大却简单的可以用来创建列表的生成式。

代码语言:javascript
复制
# a list comprehension
cubes = [i**2 for i in range(5)]
print(cubes)

运行结果:

代码语言:javascript
复制
>>>
[0, 1, 4, 9, 16]
>>>

列表生成式同样可以包含 if 条件判断,一遍创建一个符合一定条件的列表。

代码语言:javascript
复制
cubes = [i**2 for i in range(5) if i**2 % 2 ==0]
print(cubes)

运行结果:

代码语言:javascript
复制
>>>
[0, 4, 16]
>>>

通过列表生成式生成一个非常大的列表会引发 MemoryError 异常。

代码语言:javascript
复制
even = [2*i for i in range(10**150)]

运行结果:

代码语言:javascript
复制
>>>
MemoryError
>>>
代码语言:javascript
复制
这个问题我们可以通过 迭代器 来解决这个问题,迭代器将会在下一篇文章中讲到。

字符串格式化

我们经常会输出劣势 '尊敬的客户,您尾号xx的账户向xx公司完成xx交易,余额xx'之类的字符串,而 xxx 的内容都是根据变量变化的。 所以,需要一种简便的格式化字符串的方式。String 对象提供了一个 format 方法。

代码语言:javascript
复制
# string formatting
nums = [1,2,3]
msg = "Numbers:{0} {1} {2}".format(nums[0],nums[1],nums[2])
print(msg)

运行结果:

代码语言:javascript
复制
>>>
Numbers:1 2 3
>>>
代码语言:javascript
复制
每一个参数对应字符串里相应的占位符 {}。使用数字的方式不仅可以交换参数的位置,甚至可以在字符串里面换位,比如 {5} 在最前面。

字符串格式化也可以用命名参数替换。

代码语言:javascript
复制
msg = "{a},{b}".format(a=5,b=15)
print(msg)

运行结果:

代码语言:javascript
复制
>>>
5,15
>>>

Python 还提供了另一种格式化的方法。这种格式化方式和 C 语言一致用 % 实现,举例如下:

代码语言:javascript
复制
s = 'Hello,%s' % 'Python'
print(s)
s = 'Hi,%s,you have $%d' % ('man',100)
print(s)

运行结果:

代码语言:javascript
复制
>>>
Hello,Python
Hi,man,you have $100
>>>

% 运算符就是用来格式化字符串的,下图是常见的占位符。

在字符串内部,%s 表示用字符串替换,%d表示用整数替换,有几个 %? 占位符,后面就跟几个变量或者值,顺序需要对应好。如果只有一个 %?,括号可以省略。

常用方法

字符串方法

Python 标准库内建一些常用的方法。 join - 用一个字符串作为分隔符连接字符串列表。 replace - 对字符串进行替换操作。 startswith - 字符串是否以另一个字符串开头。 endswith - 字符串是否以另一个字符串结束。 upperlower - 返回字符串以大写或小写的形式。 split - 切割字符串为列表。

代码语言:javascript
复制
print(",".join(["man","and","boy"]))
print("Hello me".replace("me","world"))
print("This is a man".startswith("This"))
print("This is a woman".endswith("woman"))
print("this is a boy".upper())
print("THIS IS A GIRL".lower())
print("man,and,boy".split(","))

运行结果:

代码语言:javascript
复制
>>>
man,and,boy
Hello world
True
True
THIS IS A BOY
this is a girl
['man', 'and', 'boy']
>>>

数学方式 maxmin - 查找一组数里最大和最小的值。 abs - 绝对值。 round - 四舍五入 sum - 数字列表里数字的总和。

代码语言:javascript
复制
print(max(9,8,7,4,5,2,1))
print(min(1,2,3,4,0,-5))
print(abs(-41))
print(abs(32))
print(sum([100,455,78,-584]))

运行结果:

代码语言:javascript
复制
>>>
9
-5
41
32
49
>>>

列表方法 标准库提供了一些非常有用的函数,allany 函数为我们对列表进行条件判断提供了方便。函数 enumerate 也提供了另一种方式来遍历列表的方法。

代码语言:javascript
复制
nums = [14,51,48,46,11]

if all([i > 6 for i in nums]):
 print("All larger than 6")

if any([i % 2 == 0 for i in nums]):
 print("At least on is even")

for v in enumerate(nums):
 print(v)

运行结果:

代码语言:javascript
复制
>>>
All larger than 6
At least on is even
(0, 14)
(1, 51)
(2, 48)
(3, 46)
(4, 11)
>>>

文本分析 现在我们来做学习一个文本分析的具体例子,我们来分析文本里每个字母出现的百分比。首先我们打开一个文件并读取内容。

代码语言:javascript
复制
filename = input("Enter a filename: ")
with open(filename) as f:
msg= f.read()

print(msg)

运行结果:

代码语言:javascript
复制
Enter a filename: test.txt
I like Python!!!!!
I like Python!!!!
I like Python!!!
I like Python!!
I like Python!
I like Python

下面代码用来统计一个字母出现在字符串的次数。

代码语言:javascript
复制
def count_char(test,char):
 count = 0
 for c in test:
  if c == char:
   count += 1
 return count

这个函数接受两个参数,一个是字符串,一个是字母,返回字母出现在字符串的次数。现在我们可以打开文件调用它。

代码语言:javascript
复制
filename = input("Enter a filename: ")
with open(filename) as f:
 msg= f.read()

print(count_char(msg,'P'))

运行结果:

代码语言:javascript
复制
>>>
Enter a filename: test.txt
6
>>>
代码语言:javascript
复制
字母 "P" 总共出现在文件里 6 次。

接下来就是统计每个字母出现在文件的百分比。

代码语言:javascript
复制
for char in "AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPpQqRrSsTtUuVvWwXxYyZz":
 percent = 100 * count_char(msg,char) / len(msg)
 print("{0} - {1}%".format(char,round(percent,2)))

把所有的代码合并在一起运行。

代码语言:javascript
复制
def count_char(content,char):
 count = 0
 for c in content:
  if c == char:
   count += 1
 return count

filename = input("Enter a filename: ")
with open(filename) as f:
 msg= f.read()

 print(count_char(msg, 'P'))
for char in "AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPpQqRrSsTtUuVvWwXxYyZz":
 percent = 100 * count_char(msg,char) / len(msg)
 print("{0} - {1}%".format(char,round(percent,2)))

运行结果:

代码语言:javascript
复制
>>>
Enter a filename: test.txt
6
A - 0.0%
a - 0.0%
B - 0.0%
b - 0.0%
C - 0.0%
c - 0.0%
...
H - 0.0%
h - 6.0%
I - 6.0%
i - 6.0%
J - 0.0%
...
>>>

“今年的我们已与去年不同,我们的爱人亦是如此,如果变化中的我们依旧爱着那个变了的另一半,那是幸运所致。”    

                                      -- 毛姆(英国小说家/故事圣手)

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-04-09 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档