前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python 强化训练:第二篇

Python 强化训练:第二篇

作者头像
谢伟
发布2018-06-06 11:59:29
3960
发布2018-06-06 11:59:29
举报
文章被收录于专栏:GopherCoderGopherCoder

强化训练:第二篇

摘要:心好累.

问题来源

  1. 爬虫中会经常会遇到字符串的处理

主要内容

  1. 拆分字符串
  2. 字符串开头结尾
  3. 调整字符串格式
  4. 拼接字符串
  5. 字符串对齐
  6. 出掉不需要的字符
  7. 匹配字符
  8. 搜索字符

1.

拆分字符串

  1. 内置str.split(): 只能分割一个
  2. re.split(): 按模式进行分割
代码语言:javascript
复制
import re
data_one = "ab;cd|efg|hi,jkl|mn\topq;rst,uv\twx\t  y\nz"
pattern = r";+|,+|\t+|\n+|\s+|\|+"
result = re.split(pattern, data_one)
print(result)  #['ab', 'cd', 'efg', 'hi', 'jkl', 'mn', 'opq', 'rst', 'uv', 'wx', '', 'y', 'z']

2.

字符串开头结尾

  1. str.startswith()
  2. str.endswith()
代码语言:javascript
复制
filename = "learnpython.py"

print(filename.startswith("learn"))

print(filename.endswith(".py"))

3.

调整字符串格式2016-10-31替换成31/10/2016

  1. re.sub():替换
代码语言:javascript
复制
A="2016-10-31"
print(re.sub(r"(?P<year>\d{4})-(?P<month>\d{2})-(?P<day>\d{2})", r"\g<day>/\g<month>/\g<year>", A))
#31/10/2016

4.

拼接字符串

  1. join
代码语言:javascript
复制
values = ["apple", 'orange', "pear", "banana"]
str_temp = ""
for i in values:
    str_temp += i

print(str_temp)  #appleorangepearbanana
str_other = ''.join(values)    #appleorangepearbanana
str_one = "+".join(values)    #apple+orange+pear+banana
str_two = "====".join((values))    #apple====orange====pear====banana
print(str_other, str_one, str_two)

5.

字符串对齐

  1. str.ljust()
  2. str.rjust()
  3. str.center()
  4. format()
代码语言:javascript
复制
sentence = 'Shanghai University'

print(sentence.ljust(50))
print(sentence.rjust(50))
print(sentence.center(50))

print(format(sentence, "<50"))
print(format(sentence, ">50"))
print(format(sentence, "^50"))



#Shanghai University                               
#                               Shanghai University
#               Shanghai University                
#Shanghai University                               
#                               Shanghai University
#               Shanghai University  

6.

出掉不需要的字符

  1. str.strip()
  2. str.lstrip()
  3. str.rstrip()
  4. re.sub()
代码语言:javascript
复制
words = '============Shanghai++++++University==============='

print(words.strip("="))    #Shanghai++++++University

print(words.lstrip("="))    #Shanghai++++++University===============

print(words.rstrip("="))    #============Shanghai++++++University

word_pattern = r'=+|\++'

print(re.sub(word_pattern, '', words))    #ShanghaiUniversity

7.

匹配字符

  1. re.match()

8.

搜索字符

  1. str.find()
  2. re.findall()

参考:[python cookbook]

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2016.10.31 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 强化训练:第二篇
  • 问题来源
  • 主要内容
    • 1.
      • 2.
        • 3.
          • 4.
            • 5.
              • 6.
                • 7.
                  • 8.
                  领券
                  问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档