首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >BS4返回到Cloudflare网站,而不是实际的网站

BS4返回到Cloudflare网站,而不是实际的网站
EN

Stack Overflow用户
提问于 2021-01-15 04:43:50
回答 1查看 288关注 0票数 0

这是我的代码。这是有效的,但当代码打印时,它会打印DDOS攻击网站,而不是加载之后的网站。我甚至尝试做一个time.sleep(5)来帮助计时。

我怎么才能克服这一点。

代码语言:javascript
运行
复制
import requests
from bs4 import BeautifulSoup
import time


url = 'https://www.psacard.com/cert/49628062'
headers = {'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:80.0) Gecko/20100101 Firefox/80.0'}
soup = BeautifulSoup(requests.get(url, headers=headers).content, 'html.parser')

for a in soup.select('div'):
    print(a)
EN

回答 1

Stack Overflow用户

发布于 2021-01-15 04:52:42

如果网页的任何部分是动态呈现的,例如使用Javascriptbeautifulsoup可能无法使用它。使用Selenium进行抓取。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65726629

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档