首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何找出url是否包含img或其他文件?如何排除这些文件,只下载图片?

要找出URL是否包含img或其他文件,可以使用正则表达式来匹配URL中的文件类型。以下是一个示例代码,可以帮助你实现这个功能:

代码语言:txt
复制
import re

def check_url(url):
    # 匹配URL中的文件类型
    file_types = re.findall(r'\.(\w+)$', url)
    
    if 'img' in file_types:
        return True
    else:
        return False

# 示例用法
url1 = 'https://example.com/image.jpg'
url2 = 'https://example.com/document.pdf'

if check_url(url1):
    print('URL包含图片文件')
else:
    print('URL不包含图片文件')

if check_url(url2):
    print('URL包含图片文件')
else:
    print('URL不包含图片文件')

上述代码使用正则表达式 \.\w+$ 来匹配URL中的文件类型,然后判断是否包含img文件类型。如果包含img文件类型,则返回True,否则返回False。

如果你只想下载图片文件,可以在代码中添加相应的逻辑来实现。以下是一个示例代码,可以帮助你实现只下载图片的功能:

代码语言:txt
复制
import requests
import re

def download_image(url, save_path):
    response = requests.get(url)
    
    # 获取文件名
    file_name = re.findall(r'/([^/]+)$', url)[0]
    
    # 判断文件类型是否为图片
    file_type = re.findall(r'\.(\w+)$', file_name)[0]
    if file_type.lower() not in ['jpg', 'jpeg', 'png', 'gif']:
        print('文件类型不是图片,无法下载')
        return
    
    # 保存图片
    with open(save_path + file_name, 'wb') as f:
        f.write(response.content)
    
    print('图片下载完成')

# 示例用法
url1 = 'https://example.com/image.jpg'
url2 = 'https://example.com/document.pdf'
save_path = '/path/to/save/'

download_image(url1, save_path)
download_image(url2, save_path)

上述代码使用requests库来发送HTTP请求,并使用正则表达式来判断文件类型是否为图片。如果文件类型是图片,则将其保存到指定的路径中。

请注意,以上代码仅为示例,实际应用中可能需要根据具体需求进行适当的修改和优化。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • [编程经验] 我是如何半自动抓取素材公社图片的

    网络爬虫是一件比较繁琐的事情,特别考验人的耐心。但又是非常令人着迷的一件事,因为当你从网络上爬到了自己的想要的数据,满满的成就感油然而生。但是我对爬虫掌握的并不好,所以我只能把我知道了,在这里做个分享,讲的不好,请见谅。记得当时找实习工作的时候,去面试某家公司的Python工程师,去了给了我一份标准的爬虫工程师的试卷,做完一脸懵逼啊!面试官都不想和我说话的感觉(./嫌弃.sh)。我觉得哈,面试者能力在差,你也不能表现出满眼的鄙视吧,这说明什么?!这种公司不去也罢! 简单介绍一下我对爬虫的理解。开始学习爬虫是

    05

    「Python爬虫系列讲解」十二、基于图片爬取的 Selenium 爬虫

    前文回顾: 「Python爬虫系列讲解」一、网络数据爬取概述 「Python爬虫系列讲解」二、Python知识初学 「Python爬虫系列讲解」三、正则表达式爬虫之牛刀小试 「Python爬虫系列讲解」四、BeautifulSoup 技术 「Python爬虫系列讲解」五、用 BeautifulSoup 爬取电影信息 「Python爬虫系列讲解」六、Python 数据库知识 「Python爬虫系列讲解」七、基于数据库存储的 BeautifulSoup 招聘爬取 「Python爬虫系列讲解」八、Selenium 技术 「Python爬虫系列讲解」九、用 Selenium 爬取在线百科知识 「Python爬虫系列讲解」十、基于数据库存储的 Selenium 博客爬虫 「Python爬虫系列讲解」十一、基于登录分析的 Selenium 微博爬虫

    03
    领券