前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python字符串的基本用法总结

Python字符串的基本用法总结

作者头像
py3study
发布2020-01-09 16:26:27
1.1K0
发布2020-01-09 16:26:27
举报
文章被收录于专栏:python3python3

    字符串序列用于表示和存储文本,python中字符串是不可变对象。通常由单引号(' ),双引号(" ),三引号(''' """)包围,其中三引号可以由多行组成,编写多行文本的快捷语法,常用语文档字符串,在文件的特定地点,被当做注释。便捷的多行注释。

Python实际三类字符串:

1.通常意义字符串(str)

2.原始字符串,以大写R 或 小写r开始,r'',不对特殊字符进行转义

3.Unicode字符串,u'' basestring子类

python中字符串支持索引、切片操作。

(1)一个小技巧

    先来说个小技巧吧,对于怎么编写多行字符串,除了用三个连续的双引号外,还要一个小技巧,看下面代码。

代码语言:javascript
复制
#coding=utf-8
s = ('select *'
     'from atable'
     'where id=888')
print s

输出的结果是'select *from atablewhere id=888'。python中有个这样的特性:python中遇到未闭合的小括号时会自动将多行代码拼接为一行和把相邻的两个字符串字面量拼接到一起。相比使用三个连续的单(双)引号,这种方式不会把换行符和前导空格也当作字符串的一部分。

注意:上面的例子,s不是元组,需要在后面加逗号才会是元组,如下

代码语言:javascript
复制
#coding=utf-8
s = ('select *'
     'from atable'
     'where id=888',)
print s,type(s)

结果如下:

('select *from atablewhere id=888',) <type 'tuple'>

(2)如何判断一个对象是不是字符串

    python中字符串有两重,一种是str,一种是unicode。那如何判断一个对象是不是字符串呢?应该使用isinstance(s,basestring),而不是isinstance(s,str)。看下面例子

>>>a = 'hi'

>>>isinstance(a,str)

True

>>>b = u'Hi'

>>>isinstance(b,str)

False

>>>isinstance(b,basestring)

True

>>>isinstance(b,unicode)

True

>>>isinstance(a,unicode)

False

要正确判读一个对象是不是字符串,要有basestring,因为basestring是str和unicode的基类,包含了普通字符串和unicode类型。

(3)str对象的基本用法

字符串的基本用法可以分以下五类,即性质判定、查找替换、分切与连接、变形、填空与删减。

(a)性质判定

性质判定有以下几个方法。

isalnum():是否全是字母和数字,并至少有一个字符

isalpha():是否全是字母,并至少有一个字符 

isdigit():是否全是数字,并至少有一个字符

islower():字符串中字母是否全是小写

isupper():字符串中字母是否全是小写

isspace():是否全是空白字符,并至少有一个字符

istitle():判断字符串是否每个单词都有且只有第一个字母是大写

startswith(prefix[,start[,end]]):用于检查字符串是否是以指定子字符串开头,如果是则返回 True,否则返回 False。如果参数 start 和 end 指定值,则在指定范围内检查。

endswith(suffix[,start[,end]]):用于判断字符串是否以指定后缀结尾,如果以指定后缀结尾返回True,否则返回False。可选参数"start"与"end"为检索字符串的开始与结束位置。

is*()这些都比较简单,从字母的字面上就可以理解,*with()函数可以接受start和end参数,如果善加利用可以优化性能。另外,从python 2.5版本起,*with()函数族的第一个参数可接受tuple类型实参,当实参中某个元素匹配时,即返回True。

(b)查找与替换

count(sub[,start[,end]]):统计字符串里某个字符sub出现的次数。可选参数为在字符串搜索的开始与结束位置。这个数值在调用replace方法时用得着。

find(sub[,start[,end]]):检测字符串中是否包含子字符串sub,如果指定start(开始) 和 end(结束) 范围,则检查是否包含在指定范围内,如果包含子字符串返回开始的索引值,否则返回-1

index(sub[,start[,end]]):跟find()方法一样,只不过如果sub不在 string中会抛出ValueError异常。

rfind(sub[,start[,end]]):类似于 find()函数,不过是从右边开始查找。

rindex(sub[,start[,end]]):类似于 index(),不过是从右边开始。

replace(old,new[,count]):用来替换字符串的某些子串,用new替换old。如果指定count参数话,就最多替换count次,如果不指定,就全部替换

    前面五个方法都可以接受start、end参数,善加利用可以优化性能。对于查找某个字符串中是否有子串,不推荐使用index族和find族方法,推荐使用in和not in操作

(c)分切与连接

partition(sep):用来根据指定的分隔符将字符串进行分割,如果字符串包含指定的分隔符,则返回一个3元的元组,第一个为分隔符左边的子串,第二个为分隔符本身,第三个为分隔符右边的子串。如果sep没有出现在字符串中,则返回值为(sep,",")。partition() 方法是在2.5版中新增的。

rpartition(sep):类似于 partition()函数,不过是从右边开始查找.

splitness([keepends]):按照行('\r', '\r\n', \n')分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。

split(sep[,maxsplit]]):通过指定分隔符对字符串进行切片,如果参数maxsplit 有指定值,则仅分隔 maxsplit 个子字符串,返回分割后的字符串列表。

rsplit(sep[,maxsplit]]):同split(),不过是从右边开始。

看下面例子

代码语言:javascript
复制
str1 = 'ab c\n\nde fg\rkl\r\n'
print str1.splitlines();

str2 = 'ab c\n\nde fg\rkl\r\n'
print str2.splitlines(True)

输出如下:

['ab c', '', 'de fg', 'kl']

['ab c\n', '\n', 'de fg\r', 'kl\r\n']

split()函数有个小陷阱,比如对于字符串s,s.split()和s.split(" ")的返回值不同。看下面代码

代码语言:javascript
复制
s = "  hello world"#前面有两个空格
print s.split()
print s.split(' ')

输出结果如下

['hello', 'world']

['', '', 'hello', 'world']

这是为什么呢?原因在于:当忽略sep参数或者sep参数为None时与明确给sep赋予字符串值时,split()采用了两种不同的算法。对于前者,split()先除去两端的空白符,然后以任意长度的空白符串作为界定符分切字符串(即连续空白符串会被单一空白符看待);对于后者则认为两个两个连续空白符之间存在一个空字符串,因此对空字符串,它们的返回值也不同。

>>>".split()

[]

>>>''.split(' ')

['']

(d)变形

lower():转换字符串中所有大写字符为小写。

upper():将字符串中的小写字母转为大写字母。

capitalize():将字符串的第一个字母变成大写,其他字母变小写。对于 8 位字节编码需要根据本地环境。

swapcase():用于对字符串的大小写字母进行转换,大写转小写,小写转大写。

title():返回"标题化"的字符串,就是说所有单词都是以大写开始,其余字母均为小写。

这些都是大小写切换,title()并不能除去字符串两端的空白符也不会把连续空白符替换成一个空格,如果有这样的需求,可以用string模块的capwords(s)函数,它能除去两端空白符,并且能将连续的空白符用一个空格符代替。看下面例子:

代码语言:javascript
复制
#coding=utf-8
import string
s = "   hello   world"
print s.title()
print string.capwords(s)

输出结果如下:

   Hello   World

Hello World

(e)删减与填充

strip([chars]):用于移除字符串头尾指定的字符(默认为空格),如果有多个就会删除多个。

ltrip([chars]):用于截掉字符串左边的空格或指定字符。

rtrip([chars]):用于截掉字符串右边的空格或指定字符。

center(width[,fillchar]):返回一个原字符串居中,并使用fillchar填充至长度 width 的新字符串。默认填充字符为空格

ljust(width[,fillchar]):返回一个原字符串左对齐,并使用fillchar填充至指定长度的新字符串,默认为空格。如果指定的长度小于原字符串的长度则返回原字符串。

rjust(width[,fillchar]):返回一个原字符串右对齐,并使用fillchar填充至长度 width 的新字符串。如果指定的长度小于字符串的长度则返回原字符串。

zfill(width):返回指定长度的字符串,原字符串右对齐,前面填充0

expandtabs([tabsize]):把字符串中的 tab 符号('\t')转为适当数量的空格,默认情况下是转换为8个。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-08-27 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档