从python中的URL列中提取部分URL

从Python中的URL列中提取部分URL可以使用正则表达式或者内置的URL解析库来实现。以下是两种常用的方法：

方法一：使用正则表达式正则表达式是一种强大的模式匹配工具，可以用来从字符串中提取特定的内容。在Python中，可以使用re模块来进行正则表达式的操作。

import re

def extract_partial_url(url):
    pattern = r'(https?://\S+)'
    match = re.search(pattern, url)
    if match:
        return match.group(1)
    else:
        return None

url = 'This is a sample URL: https://www.example.com/some-page'
partial_url = extract_partial_url(url)
print(partial_url)

输出结果：

https://www.example.com/some-page

方法二：使用urllib.parse库 Python的内置urllib.parse库提供了解析URL的功能，可以方便地提取URL的各个部分。

from urllib.parse import urlparse

def extract_partial_url(url):
    parsed_url = urlparse(url)
    if parsed_url.scheme and parsed_url.netloc:
        return parsed_url.geturl()
    else:
        return None

url = 'This is a sample URL: https://www.example.com/some-page'
partial_url = extract_partial_url(url)
print(partial_url)

输出结果：