我正在使用selenium来抓取amazon搜索结果页面。当我结束它,我把我的刮到无头模式,因为它将节省效率。然而,在无头模式下,某些页面元素不能成为可用的,如赞助品牌。它在使用非无头模式时工作非常好,但是即使在设置了以下选项之后,也无法使用无头模式:
options = Options()
#options.headless = True
options.add_argument("--window-size=1920,1080")
options.add_argument("--disable-extensions")
options.add_argument("--proxy-server='direct://'")
options.add_argument("--proxy-bypass-list=*")
options.add_argument("--start-maximized")
options.add_argument('--headless')
options.add_argument('--disable-gpu')
options.add_argument('--disable-dev-shm-usage')
options.add_argument('--no-sandbox')
options.add_argument('--ignore-certificate-errors')
options.add_argument('--allow-running-insecure-content')
driver = webdriver.Chrome(options=options)
PS:我试着用和不带注释的部分,以及只是评论的部分。
为了澄清起见,我截取了每个示例:这是它在无头模式下运行时的样子,而这是它通常看起来的样子(没有无头模式,也没有正常的用户浏览)。我想知道还需要添加什么才能让赞助品牌信息在无头模式下显示出来。我认为这可能是JavaScript与浏览器通信不正常的问题吗?
一如既往,提前谢谢!
发布于 2021-11-18 20:14:12
使用最新的GoogleChromev95.0
附加的Headless
参数/属性的存在作为一个bot被截获。因此你看到了不同之处。
https://stackoverflow.com/questions/70024441
复制相似问题