urllib.request.urlretrieve(url, filename=None, reporthook=None, data=None)
将URL表示的网络对象复制到本地文件。如果URL指向本地文件,则对象将不会被复制,除非提供文件名。返回一个元组()(filename,header),其中filename是可以找到对象的本地文件名,header是urlopen()返回的对象的info()方法(用于远程对象)。
第二个参数(如果存在)指定要复制到的文件位置(如果没有,该位置将是一个生成名称的tempfile。
第三个参数,如果存在,则是一个回调函数,它将在建立网络连接时调用一次,并且在此后每个块读取后调用一次。这个回调函数将传递三个参数;到目前为止传输的块计数,以字节为单位的块大小,以及文件的总大小。第三个参数可能是-1,在旧的FTP服务器上,它不返回文件大小以响应检索请求。
# encoding=utf-8
import os,sys,urllib.request,time
DATA_URL = 'http://www.python.org/ftp/python/2.7.5/Python-2.7.5.tar.bz2'
filename = DATA_URL.split('/')[-1]
def _progress(block_num, block_size, total_size):
'''回调函数
@block_num: 已经下载的数据块
@block_size: 数据块的大小
@total_size: 远程文件的大小
'''
sys.stdout.write('\r>> Downloading %s %.1f%%' % (filename,
float(block_num * block_size) / float(total_size) * 100.0))
sys.stdout.flush()#刷新输出
local_filename, headers= urllib.request.urlretrieve(DATA_URL, filename, _progress)
print('\n')
print(local_filename, headers)
# html = open(local_filename)
# html.close()
输出
Downloading Python-2.7.5.tar.bz2 100.0%
Python-2.7.5.tar.bz2 Server: nginx
Content-Type: application/octet-stream
Last-Modified: Sun, 12 May 2013 03:46:19 GMT
ETag: "518f108b-b95bfe"
X-Clacks-Overhead: GNU Terry Pratchett
Via: 1.1 varnish
Content-Length: 12147710
Accept-Ranges: bytes
Date: Thu, 17 Jan 2019 02:35:27 GMT
Via: 1.1 varnish
Age: 10961451
Connection: close
X-Served-By: cache-iad2148-IAD, cache-tyo19922-TYO
X-Cache: HIT, HIT
X-Cache-Hits: 0, 4
X-Timer: S1547692527.414428,VS0,VE0
Strict-Transport-Security: max-age=63072000; includeSubDomains
例子中的sys.stdout.write和print差不多是输出的意思,sys.stdout.flush()函数的作用是刷新输出
for i in range(5):
# print(i)
print(i,end='')
sys.stdout.flush()
time.sleep(1)
这个程序本意是每隔一秒输出一个数字,但是如果把这句话sys.stdout.flush()注释的话,你就只能等到程序执行完毕,屏幕上会一次性输出0,1,2,3,4。
如果你加上sys.stdout.flush(),刷新stdout,这样就能每隔一秒输出一个数字了。
可以用在网络程序中多线程程序,多个线程后台运行,同时要能在屏幕上实时看到输出信息。
参考:https://blog.csdn.net/pursuit_zhangyu/article/details/80556275