我正在开发一个打开网页的网页,如果该链接包含关键字,我将打印该网页中的任何链接(稍后我将打开这些链接,以便进一步抓取)。
例如,我使用请求模块打开"cnn.com",然后尝试解析该网页中的所有href/链接。然后,如果任何链接包含特定的单词(如“中国”),Python应该打印该链接。
我只需使用请求打开主页,将所有的href保存到列表(“链接”)中,然后使用:
links = [...]
keyword = "china"
for link in links:
if keyword in link:
print(link)
但是,这个方法的