文章/答案/技术大牛

发布

社区首页 >问答首页 >Python Web抓取:通过加载页面抓取页面

问Python Web抓取:通过加载页面抓取页面
EN

Stack Overflow用户

提问于 2020-10-25 21:21:20

回答 1查看 71关注 0票数 0

我正在建立一个网络抓取项目使用python与美丽的汤和请求模块，问题是我想要抓取的网站有一个加载页面(完全不同于主页)，然后它将我重定向到主页。我怎么能等到页面加载完成，然后从主页上抓取数据呢？我知道Selenium可以处理这些类型的网站，但网站必须使用web驱动程序启动，这是我不希望在我的项目中使用的原因，这就是为什么我使用Beautiful Soup和requests模块。到目前为止，我的代码如下。

from bs4 import BeautifulSoup
import requests
import time

source = requests.get(url).text
print(source)

我刚刚开始我的项目，到目前为止，这就是我写的所有代码。为此，我对更改模块持开放态度。

python

python-3.x

web-scraping

回答 1

Stack Overflow用户

发布于 2020-10-25 22:08:18

如果您不希望在使用selenium时启动浏览器，可以使用以下代码。

from selenium import webdriver

options = webdriver.ChromeOptions()
options.headless = True
driver = webdriver.Chrome(options=options)

driver.get('https://www.google.com/')
print(driver.title)

我已经把chrome驱动放到了我电脑的环境变量path中。如果您没有将web驱动程序放入路径中，请将驱动程序变量更改为

driver = webdriver.Chrome(executable_path='your web driver path', options=options)

我知道selenium可以处理加载页面的网站，这应该可以解决我的问题

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/64524171

复制

相似问题

问Python Web抓取:通过加载页面抓取页面
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python Web抓取:通过加载页面抓取页面EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python Web抓取:通过加载页面抓取页面
EN