前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >下载图片再也不用自己动手了

下载图片再也不用自己动手了

作者头像
大家一起学编程
发布2021-03-27 16:10:22
3260
发布2021-03-27 16:10:22
举报

漫画图片太好看,想要批量保存,可是没有提供批量保存的接口,这可怎么办,我要一张一张点吗?那是不可能的,教大家如何快速获取漫画图片。

获取漫画图片思路

漫画图片太多,万一网络断了,那就什么都没有了,过上一段时间,本来免费的漫画,突然不免费了,这可怎么办?

答案很简单,让它断网之后也可以看,这要怎么做到呢?首先我想到的就是爬虫,使用爬虫获取图片的url,然后再使用保存,文件保存,这样能获取所有的图片了,然后就获取到所有的漫画图片了,想想是不是有点心动。

先给你一个场景,假如说漫画在一段时间之后突然要收费了,但是你的漫画还可以看,这是不是一件很高兴的,然后你就可以对喜欢漫画的人说,喂!我有这部漫画,你要不要,20块买给你了。

代码实现

下面是代码的实现过程:

代码语言:javascript
复制
import re
import os
import requests
import time
import random

class kumiean():
代码语言:javascript
复制
def __init__(self):
    self.f="D:\\漫画\\"
    self.list=['Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50','Opera/9.80 (Windows NT 6.1; U; en) Presto/2.8.131 Version/11.11',
                'Mozilla/5.0(Macintosh;U;IntelMacOSX10_6_8;en-us)AppleWebKit/534.50(KHTML,likeGecko)Version/5.1Safari/534.50',
                'Mozilla/5.0(Windows;U;WindowsNT6.1;en-us)AppleWebKit/534.50(KHTML,likeGecko)Version/5.1Safari/534.50',
                'Mozilla/5.0(compatible;MSIE9.0;WindowsNT6.1;Trident/5.0;',
                'Mozilla/4.0(compatible;MSIE8.0;WindowsNT6.0;Trident/4.0)',
                'Mozilla/5.0(WindowsNT6.1;rv:2.0.1)Gecko/20100101Firefox/4.0.1',
                'Opera/9.80(Macintosh;IntelMacOSX10.6.8;U;en)Presto/2.8.131Version/11.11',
                'Mozilla/5.0(Macintosh;IntelMacOSX10_7_0)AppleWebKit/535.11(KHTML,likeGecko)Chrome/17.0.963.56Safari/535.11',
                'Mozilla/4.0(compatible;MSIE7.0;WindowsNT5.1;TencentTraveler4.0)',
                'Mozilla/4.0(compatible;MSIE7.0;WindowsNT5.1;Trident/4.0;SE2.XMetaSr1.0;SE2.XMetaSr1.0;.NETCLR2.0.50727;SE2.XMetaSr1.0)',
                'Mozilla/4.0(compatible;MSIE7.0;WindowsNT5.1;360SE)',
                'Mozilla/4.0(compatible;MSIE7.0;WindowsNT5.1;Trident/4.0;InfoPath.2;.NET4.0C;.NET4.0E;.NETCLR2.0.50727;360SE) ',
                'Mozilla/5.0(iPhone;U;CPUiPhoneOS4_3_3likeMacOSX;en-us)AppleWebKit/533.17.9(KHTML,likeGecko)Version/5.0.2Mobile/8J2Safari/6533.18.5',
                'Mozilla/4.0(compatible;MSIE7.0;WindowsNT5.1;Trident/4.0;TencentTraveler4.0;.NETCLR2.0.50727)',
                'Opera/9.80(Android2.3.4;Linux;Operamobi/adr-1107051709;U;zh-cn)Presto/2.8.149Version/11.10']
    self.headers = {
                    'User-Agent': random.choice(self.list)
                    }
代码语言:javascript
复制
def url_4(self,url1):
    """获取本漫画的所有章节url"""
    time.sleep(random.uniform(1, 4))
    html = requests.get(url1, headers=self.headers)
    ti = r'''<a href="(.*?)" title="(.*?)" target="_blank" style="max-width: 200px;">.*?</a>'''
    url = re.findall(ti, html.text)
    if url==[]:
         pass
    else:
        for j in set(url):
            self.f_3=self.f_2+"\\" + j[1]
            if os.path.isdir(self.f_3)==True:
                continue
            else:
                try:
                    os.mkdir(self.f_3)
                except:
                    continue
            self.url_5(j[0])
def url_5(self,url1):
    """保存该漫画的本话的所有图片"""
    html = requests.get(url1, headers=self.headers)
    ti = r'''<li style="margin-top: -3.6px"><span><img src="(.*?)" data-image_id="\d+" id="image_\d+"></span></li>'''
    url = re.findall(ti, html.text)
    if url == []:
        print("vip章节,不能获取到目录")
        return
    else:
        for j, url3 in enumerate(url):
            f_4=self.f_3+"\\" + str(j) + ".jpeg"
            if os.path.exists(f_4)==True:
                continue
            else:
                ht = requests.get(url3, headers=self.headers).content
                with open(f_4, "wb") as f:#写入文件中
                    f.write(ht)

好了,以上就是所有的代码,另外为了方便使用,专门制作了打包了一个软件,只需要输入你想要抓取的url地址就可以轻松获取到漫画。

注:本软件只适合个人使用,请勿用于商业用途。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-10-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大家一起学编程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档