首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >使用Python而不使用Selen的Web Scraping

使用Python而不使用Selen的Web Scraping
EN

Stack Overflow用户
提问于 2018-09-18 04:40:21
回答 1查看 0关注 0票数 0

我试图用Python抓取一些网页,我无法管理它。

网页使用Javascript加载,因此我无法使用“请求”或urllib。我尝试安装Selenium,但我没有安装Chrome webdriver(也许是因为我有64位Win?)。

我也试过使用Ghost,但我遇到了一些导入问题。

我还可以使用哪些其他选项?或者也许我可以在没有webdriver的情况下使用Selenium?

EN

回答 1

Stack Overflow用户

发布于 2018-09-18 14:20:01

您可以选择安装Chrome webdriver,它在win64(win 7,win 10)上运行完美,甚至可以在无头模式下运行Chrome浏览器。我建议安装Anaconda64 for windows。然后从http://chromedriver.chromium.org/downloads下载最新版本的win32,解压zip,将.exe文件放在好位置,确保你已经更新了Chrome浏览器并安装了selenium

pip install --upgrade selenium

或者,如果你安装了Anaconda / Miniconda:

conda install selenium

你可以使用这样的东西:

from selenium import webdriver

path_to_chromedriver = 'c:/webdrivers/chrome/chromedriver.exe'

def get_chromedriver(implicitly_wait=140, headless=True):
    if headless:
        options = webdriver.ChromeOptions()
        options.add_argument('headless')
        options.add_argument("--window-size=1920,1080")
        driver = webdriver.Chrome(executable_path=path_to_chromedriver, chrome_options=options)
    else:
        driver = webdriver.Chrome(executable_path=path_to_chromedriver)
    driver.implicitly_wait(implicitly_wait)
    driver.maximize_window()
    return driver

browser = get_chromedriver(30, headless=False)

headless =当你开始这样的事情时,真的很糟糕:

from selenium.webdriver.common.alert import Alert

PS:你也可以用scrapy-splash进行scrapy但是它会更难,所有那些产量的收益......

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/-100002668

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档