俺好久没用python的pip了, 今天pip3 install you-get的时候提示我要更新了。
You are using pip version 19.1.1, however version 20.0.2 is available. You should consider upgrading via the 'python -m pip install --upgrade pip' command. 然而直接打系统提示的那一行语句会报错更新不了,还是用清华源更香。
python -m pip install --upgrade pip -i https://pypi.tuna.tsinghua.edu.cn/simple/
然后安装you-get(github上有31481个star⭐了 ??嗷)。
pip3 install you-get
you-get的使用非常简单,只要在终端输入形如"you-get URL(目标视频的url)"的命令就能够自动下载对应的视频。当然,you-get命令还有一些功能参数,我这里就不一一介绍了,大家可以去GitHub上查看官方demo,其中最为常用的有两个:
①--info/-i 这个参数的作用是解析出该地址下的视频信息,you-get命令仅会显示目标视频的基本信息,而不会开始下载视频。
②--output-dir
/ -o
可以
设置路径,并使用--output-filename
/ -O
设置下载文件的名称。官网给出的示例如下:
you-get -o ~/Videos -O zoo.webm 'https://www.youtube.com/watch?v=jNQXAC9IVRw'
当然还有一种方法就是cd进入目标文件夹下,再you-get下载,可以看到显示完目标视频的基本信息后会开始下载。
我不想用cmd了,我想用pyCharm,那么怎么在pyCharm里调用呢。我这里是通过os调用的。
import os
os.system("you-get -o E://video/ https://www.bilibili.com/video/av79890922?spm_id_from=333.851.b_62696c695f7265706f72745f63696e657068696c65.9")
当然你也可以直接导入you_get库来进行爬取。
import sys
from you_get import common as you_get #导入you-get
directory = r'E:\video' #设置下载目录
url = 'https://www.bilibili.com/video/av55338853' #需要下载的视频链接
sys.argv = ['you-get','-o',directory,url] #sys传递参数执行下载,就像在命令行一样
you_get.main()
至于怎么爬取一个系列的视频就自己写了,我这里就不举例啦。