首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >BeautifulSoup将<div class=“页面内容”>输出为<div class=“页面内容加载”>,但没有分区的任何内容?

BeautifulSoup将<div class=“页面内容”>输出为<div class=“页面内容加载”>,但没有分区的任何内容?
EN

Stack Overflow用户
提问于 2021-03-14 00:18:06
回答 2查看 23关注 0票数 1

我正在尝试从一个网站上抓取一些信息,但是输出结果与网页的html不同。我试图从网页中获取的内容在

代码语言:javascript
运行
复制
<div class="page-content">

但在我的漂亮的shows对象中,它显示为:

代码语言:javascript
运行
复制
<div class="page-content loading"></div>

在组织中什么都没有。我试着去找我想要的东西,但是一无所获。我还尝试了html5lib和lxml解析器,但这并没有改变输出。是不是浏览器运行了某种javascript代码,使我无法获取完整的网页html或其他内容?我是新手,所以任何建议都将不胜感激。

下面是我的脚本:

代码语言:javascript
运行
复制
URL = 'https://zone4.ca/race/2020-11-08/c91ec8f6/results'
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')

results = soup.find_all("div", class_="racer-row")

print(results)
print(soup)
EN

Stack Overflow用户

发布于 2021-03-14 00:43:17

是的,它肯定是通过javascript查询加载内容的。您可以复制这些查询的内容(标头、有效负载...)并通过requests库手动发送它们,或者(最好是imo)使用浏览器模拟驱动程序(如selenium )来抓取动态页面。

票数 0
EN
查看全部 2 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66615780

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档