我试图从这个网站:中抓取存储在href值中的链接。r = requests.get(url)soup = BeautifulSoup(html_doc, 'html.parser')
[tag['href'] for tag in soup.find_all('a',{'class':'css-11smhdq-FtContainer e1ym2d3s2&
我正在尝试从here抓取文章的日期和网址。虽然我确实得到了日期列表和文章的标题(文本),但我无法获得相同的Urls。这就是我如何在文本和日期中获得url标题。为了获得所有人的链接,我尝试如下所示 n_links = [ele.get_attribute('href') for ele in news_links.find_elements_by_tag_name
我正在试着从一个新闻网站上抓取URLS。具体地说,它们是针对特定搜索词的搜索结果中列出的新闻文章的URL。我刚接触BeautifulSoup,我不知道如何有选择地抓取链接到一篇文章的href(当我试图抓取div标签中的子href时,我只得到一个空集,而当我抓取一个标记时,我得到的URL远远多于我想要的。q=aramco 这是我正在使用的代码。import requests, random, re
from bs4 import Beautifu