首页
学习
活动
专区
工具
TVP
发布

Python当中字符串的知识点梳理

(声明:文章所有的内容来自python官网的英文文档和python学习手册以及作者本人的理解,最终解释权归作者本人所有)

1

我们为什么要学习字符串的一些处理方法,因为这样对于将来我们做爬虫的时候有一定的帮助,我们从不同网站上爬取下来的数据格式都不一样,里面含有很多的空格和特殊字符,所以直接拿来使用肯定是不方便的,我们要利用字符串的方式对其做一些清理。

计算机里面是如何存储字符串的,最小的分配单元就是一个字节,一个字节存储的最大值是255,所以255以下的数字存储都是一个字节,如果是100的字符串,不管你的双引号里面是什么东西,一个东西占用一个字节。所以字符串100占用的是3个字节,与c语言不一样,C语言是四个字节,它后面多了一个“\0”。

cpu 读写的速度远远超过硬盘数据的传输速度,因为硬盘既要存储存储大量的东西,速度就上不去,所以就出现了内存,整合两者的特点,存储的数据远远大于cpu,而内存的数据传输速度远远高于硬盘。

字符串是不可变,同样是加法,python会判断执行加法两边的类型不一样,执行的效果也是不一样的,同时可以用占位符的方式去拼接一个字符串。

2

在这里讲一下python字符串的几种常用的处理方法:

s.find()

在一个大的文件当中找出某个字符串,如果有,则出现这个字符串首字母的下标。如果没有,则返回-1.

s.replace()

这个函数主要是作为替换字符串之用的,因为我们用爬虫从网上爬取数据之后,需要对其进行简单的清理,上面可能存在错误的单词,或者一些敏感词汇我们需要隐去。

s.split:

切割 按照空格

进行切割。

如果想按照换行符进行分割,我们可以调用splitlines()的切割

s.partition()也是一种切割,但是这种是根据括号中的字符串来分成三个等分,中间字符串左边的,中间字符串,中间字符串右边的。

3

s.isalpha:

判断这个字符串是否为纯字母,如果是,则为True,否则的话,则为False

isdigit():判断纯数字

isalnum():即是数字也是字母

这些一般用在后台对用户输入的数据进行判断,尤其是对密码的输入,我们需要对这些进行一个筛选。

Isspace 判断是否是纯空格

Startwith 判断以什么东西开头

Endwith 判断以什么东西结尾

在这里我们要实现一个函数,完成一个单独的功能,就是对真正的内容进行判断,以确保用户输入的不是伪装的病毒

4

Lower()让字符串的所有字母小写,upper()让字符串的所有字母大写

用户输入的情况不一样怎么判断大小写问题,为了防止用户输入的东西和你的期望不一样,我们可以用上面这种方法统统给你转换为小写或者大写,这样就可以做一次性if判断。

居中center() 靠左对齐ljust() 靠右对齐rjust()

这种方法是为了让我们的字符串输出排版比较美观,在括号里我们只需要输入总的字节数。

Strip()

是左边和右边包括反斜杠都可以去掉,只要是空格都可以去掉

Lstrip(去掉左边的空格反斜杠啥的)

Rstrip(去掉右边的空格反斜杠啥的)

如果这些字符串的方法没有满足你的胃口,你可以在python的交互模式下,用一个变量绑定一个字符串,然后变量名后面加.,按下tab键,就可以看到字符串的所有方法了。

小贴士:

学生在看视频的时候第一次听总是没有声音,可能是我们的电脑音频驱动坏了,可以先将旧的音频驱动卸载,然后安装上驱动人生一类软件,就会自行用它自带的驱动安装上就可以正常听到声音了。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180507G06RPV00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券