首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Python Web抓取:通过加载页面抓取页面

Python Web抓取:通过加载页面抓取页面
EN

Stack Overflow用户
提问于 2020-10-25 21:21:20
回答 1查看 71关注 0票数 0

我正在建立一个网络抓取项目使用python与美丽的汤和请求模块,问题是我想要抓取的网站有一个加载页面(完全不同于主页),然后它将我重定向到主页。我怎么能等到页面加载完成,然后从主页上抓取数据呢?我知道Selenium可以处理这些类型的网站,但网站必须使用web驱动程序启动,这是我不希望在我的项目中使用的原因,这就是为什么我使用Beautiful Soup和requests模块。到目前为止,我的代码如下。

代码语言:javascript
运行
复制
from bs4 import BeautifulSoup
import requests
import time

source = requests.get(url).text
print(source)

我刚刚开始我的项目,到目前为止,这就是我写的所有代码。为此,我对更改模块持开放态度。

EN

回答 1

Stack Overflow用户

发布于 2020-10-25 22:08:18

如果您不希望在使用selenium时启动浏览器,可以使用以下代码。

代码语言:javascript
运行
复制
from selenium import webdriver

options = webdriver.ChromeOptions()
options.headless = True
driver = webdriver.Chrome(options=options)

driver.get('https://www.google.com/')
print(driver.title)

我已经把chrome驱动放到了我电脑的环境变量path中。如果您没有将web驱动程序放入路径中,请将驱动程序变量更改为

代码语言:javascript
运行
复制
driver = webdriver.Chrome(executable_path='your web driver path', options=options)

我知道selenium可以处理加载页面的网站,这应该可以解决我的问题

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64524171

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档