专栏首页Python爬虫与算法进阶Python中的小魔法(二)

Python中的小魔法(二)

01

函数

局部变量

x = 66

def func(x):
    print('x等于', x)
    x = 6
    print('局部变量x改变为', x)

func(x)
print('x一直是', x)

结果

x等于66
局部变量x改变为6
x一直是66

使用全局声明

x = 66

def func():
    global x

    print('x的值是', x)
    x = 6
    print('全局变量x改为', x)

func()
print('x的值是', x)

结果

x的值是66
全局变量to改为6
x的值是6

02

模块

字节编译的.pyc文件

导入一个模块是一个相对昂贵的事情,所以Python做了一些技巧使它更快。一种方法是创建扩展名为.pyc的字节编译文件,是Python将程序转换成的一种中间形式。

pyc是由py文件经过编译后二进制文件,py文件变成pyc文件后,加载的速度有所提高,而且pyc是一种跨平台的字节码,是由Python的虚拟机来执行的。

注意:这些.pyc文件通常在与之相应的.py文件的同一个目录中创建。如果Python在那个目录中没有写入权限,那么.pyc文件将不会创建。

from ... import语句

常见的就是

from urllib import request

from bs4 import BeautifulSoup

from lxml import etree

一般来说,你应该避免使用这个语句,而应该使用import语句,因为你的程序将避免名称冲突,将更具可读性。

第一个模块

例子 (保存为 test.py):

def demo():
    print('哈哈,这是我写的一个模块~')

__version__ = '3.1'

在该目录下新建文件

import test

test.demo()
print('版本',test.__version__)

结果

哈哈,这是我写的一个模块~
版本 3.1

Python充分重用相同的符号产生了独特的'Pythonic'的感觉,这样我们不需要不断学习新的方法来做事情。

也可以使用from ... import语法

from test import demo,__version__

demo()
print('版本',__version__)

dir函数

>>> import urllib
>>> dir(urllib)  # 获得属性列表

['__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__',
 '__path__', '__spec__', 'error', 'parse', 'request', 'response']
>>> dir()  # 获得当前模块的属性列表
['__builtins__', '__doc__', '__loader__', '__name__', '__package__', '__spec__', 'requests', 'urllib']
>>> a = 1
>>> dir()
['__builtins__', '__doc__', '__loader__', '__name__', '__package__', '__spec__', 'a', 'requests', 'urllib']
>>> del a
>>> dir()
['__builtins__', '__doc__', '__loader__', '__name__', '__package__', '__spec__', 'requests', 'urllib']

注意,dir()函数对任何对象都起作用。例如,运行dir('str')来学习str(string)类型的更多知识。

打包(Packages)

现在,你必须开始观察组织你的程序的层次结构。变量通常在函数内部。函数和全局变量通常在模块内部。如果你想组织模块?这就到了牵涉到打包的地方了。

包只是模块的文件夹,使用一个特殊的__init__.py文件,指示Python,这个文件夹是特殊的,因为它包含Python模块。

假设你想创建一个叫做'世界'的程序包,分装'亚洲'、'非洲'等等,分包按序包含'印度'、'马达加斯加'等等。

这是你的文件结构:

- <在sys.path中现有的一些文件夹>/
    - world/
        - __init__.py
        - asia/
            - __init__.py
            - india/
                - __init__.py
                - foo.py
        - africa/
            - __init__.py
            - madagascar/
                - __init__.py
                - bar.py

本文分享自微信公众号 - Python爬虫与算法进阶(zhangslob),作者:崔斯特

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-08-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Pycharm插件推荐:Docker integration

    在设置-Plugins-BROWSE REPOSITORIES… 中搜索“Docker”

    小歪
  • Python爬虫入门(一)获取源码

    举个例子,爬一爬知乎日报的相关数据 http://daily.zhihu.com/ 1、获取源码 import requests url = 'http://d...

    小歪
  • 知乎上值得关注的Python大佬

    萌新整理了知乎上值得关注的Python大佬,来看看吧~ 综合类 @xlzd 比较全能的Python大牛,精通爬虫、后端 @廖雪峰 这个,相信大家都看过老师的入门...

    小歪
  • Android ImageView 固定宽高比例的实现方法

    方法二:使用 Universal-Image-Loader 图片缓存类,需要注意的是方法二和方法一同时使用导致设置无效。

    砸漏
  • 在知乎上学 Python - 爬虫篇

    知乎是个好地方。虽然近年来,为了吸引更多的用户,知乎的定位与早期略有点偏离。但从内容质量和专业性来说,知乎仍然是国内数一数二的知识型社区。不少同学都是通过知乎发...

    Crossin先生
  • Ubuntu16.04安装QT5.8.0

    VSCode编辑器开发CPP:http://www.cnblogs.com/dotnetcrazy/p/6661921.html 下载QT run文件(安装包)...

    逸鹏
  • Linux本地信息收集

    我们在获取到webshell之后,经常会遇到Linux的操作系统,这是我们需要对Linux系统本地的敏感资源进行信息收集,下面就是一些有用的信息获取方式。

    信安之路
  • JetBrains PyCharm(Community版本)的下载、安装和初步使用图文教程详解

      想学习Python的同学们,在这里隆重介绍一款 Python 的开发工具 pyCharm IDE。这是我最喜欢的 Python编辑器利器。而且还是跨平台的,...

    砸漏
  • 《笨办法学Python》 第17课手记

    《笨办法学Python》 第17课手记 本节内容是前几节内容的复习和综合,此外引入了exists函数。 原代码如下: from sys import argv ...

    Steve Wang
  • 面向对象多继承,网络编程,编写网络相关程

    py3study

扫码关注云+社区

领取腾讯云代金券