我正在尝试在Selenium模块(Python)的帮助下抓取一个站点https://www.mdoffice.com.ua/。这个站点需要输入登录信息和密码,这就是为什么我只能使用Selenium进行抓取。下载主页后,从这个页面移动到下一个链接,我试图看到这个页面的当前网址,但程序显示了一个主页的网址,我不能从这个页面刮任何信息(刮刮只可能的主页)。这种情况只有在这个网站上,在其他网站上,一切都没问题。示例1 '''
from
我需要替换selenium webdriver+python中以下url的一部分:
我试过使用replace,但它不起作用。下面是我使用的代码:print(current_url) #prints the url of the current window.current_url.replace("ve-215", &
我正在尝试收集网站上显示的几个链接的地址,代码如下: from selenium import webdriverfrom bs4 import BeautifulSoupto window method to move to newly opened window
current_URL= driver.current_url #Hth
我想为Bing的搜索结果做网络抓取。基本上,我使用selenium,其想法是使用selenium自动单击“Next”,并删除每个页面搜索结果的URL。我让它在我的Ubuntu上使用chrome浏览器运行:import os
def但是,我的目标是成功地在AWS上运行这些代码。原始代码失败,错误“Chrome未能启动”。在谷歌之后,