Python Selenium，检查<div ...>在web抓取代码中是否包含单词_检查句子是否在一行中包含多个单词(Python)_在html代码中找不到表单-使用Python和Selenium进行Web抓取 - 腾讯云开发者社区

python、selenium、xpath、css-selectors、webdriverwait

我想在网站上使用Selenium (与Python一起使用)的代码块(用于web抓取)如下所示- <div class="exp_date"> <span class="uppr_sec"> <i class="exp_clndr"></i> <label> 04 Jan 2021 09:30 AM - 04 Jan 2021 10:30 AM </label> </span> <br> <div cl

浏览 1提问于2021-01-04得票数 1

回答已采纳

2回答

用Python解析CSS属性值的HTML

python、html、css、selenium、phantomjs

我目前正在使用Selenium和PhantomJS与Python一起抓取呈现的网页。很容易检查HTML内容中是否存在某个单词(例如。)，但是我有兴趣在页面中搜索包含值大于或等于某个值的if "example" in html属性的元素。例如，最理想的做法是抓取一个站点列表，并保存具有CSS为元素提供z索引的页面，这个值异常大。所有内容都是构建的，除了呈现的页面的CSS爬行功能。有人对此有什么建议吗？

浏览 8提问于2015-01-06得票数 0

回答已采纳

1回答

如何让Firebug与HtmlUnitDriver的pageSource报告相匹配？

java、html、selenium、firebug、headless-browser

我使用Java和Selenium来抓取网页。当我在Firefox中的页面上使用Firebug时，我可以看到页面的源代码包含以下HTML结构： <div> <div> <table> <caption /> <thead /> <tbody /> </table> </div> </div> 但是，当我使用HtmlUnitDriver编程下载页面的源代码，然后使用driv

浏览 3提问于2016-08-28得票数 0

回答已采纳

1回答

Selenium New窗口而不是新实例？下一排CSV？

python、selenium、csv、google-chrome

我试图将多个条目提交到登录/密码后面的into表单中。数据来自CSV。在Selenium (python)中，当我的代码完成循环后，将打开一个全新的Chrome实例，其中包含一个新的配置文件，然后在进入CSV的下一行之前再次登录。我不想将我的密码存储在python文件/CSV中，也不想通过立即登录10-20次来创建奇怪的流量。是否有建议代码在同一Chrome实例中打开一个新窗口/选项卡，并在不启动新实例的情况下将数据输入移到CSV的下一行？ from selenium import webdriver import time from selenium.webdriver.common.

浏览 1提问于2022-03-25得票数 0

回答已采纳

2回答

在for循环中没有匹配时退出python脚本

python、python-3.x、for-loop、selenium-webdriver

使用python中的selenium，我想单击一个html div容器，如果它包含一些单词，如果它找不到任何单词，脚本就必须退出。对于下面的代码，如果有一个div包含text列表中的一个单词，那么它是可以工作的，但是我怎样才能退出没有这些单词的地方呢？在下面的代码中，它执行order.click，因为它在for循环之外。我只想执行order.click()，如果找到单词，我只想进一步使用脚本break的其余部分。 text = ["Dog", "Cat", "Bird"] for word in text: tr

浏览 8提问于2021-12-21得票数 3

回答已采纳

1回答

如何使用Python从这个表中抓取数据？

python、html、web-scraping、data-mining

我想用Python脚本将表中的数据保存到Excel文件中，这也不是问题。然而，该网站的源代码并不包含任何我想要的价值。如果我使用Chrome插件"DataMiner"，它可以读出数值。我如何在Python中实现这一点？在图片中，显示了我想要抓取的数据。不幸的是，这些数据并没有包含在源代码中。 from selenium import webdriver import time from bs4 import BeautifulSoup import requests url = 'https://herakles.webuntis.com/WebUntis/monit

浏览 6提问于2021-12-03得票数 0

0回答

通过BeautifulSoup找到音节的个数？

python、html、beautifulsoup

我是编程新手，目前正在尝试学习python。我的目标是使用网络抓取，或者更具体地说，BeautifulSoup在dictionary.com上抓取单词的音节，作为更大代码的一部分。这是我到目前为止所知道的： def count_syllables(keyword): url = 'http://dictionary.com/browse/{}'.format(keyword) web_object = requests.get(url) text = web_object.text text = text.encode('utf-8

浏览 3提问于2017-06-09得票数 0

回答已采纳

2回答

如何用Python编码/解码这个BeautifulSoup字符串，以便输出非标准的拉丁字符？

python、utf-8、beautifulsoup、character-encoding

我正在用“美丽汤”抓取一个页面，输出包含显示为十六进制的非标准拉丁字符。我在刮。它包含拼音单词，使用非标准拉丁字符(例如ǎ，ā)。我一直试图循环一系列包含拼音的链接，使用BeautifulSoup .string函数和utf-8编码输出这些单词。这个词在非标准字符的地方出现了十六进制。单词"hǎo“以"h\xc7\x8eo”的形式出现。我确信我在对它进行编码时做错了什么，但我不知道该修复什么。我试着先用utf-8解码，但我得到了一个错误，即元素没有解码函数。试图打印字符串而不进行编码会给我一个关于未定义字符的错误，我想，这是因为它们需要首先被编码。 from selenium

浏览 2提问于2018-12-22得票数 3

回答已采纳

1回答

用Laravel和Selenium进行Web抓取

php、laravel、selenium、web-scraping

我目前正在使用Python进行web抓取。我使用了Selenium和Beautifulsoup库来抓取。我最近知道Selenium适用于php/Laravel。我的问题是，我可以使用Laravel + Selenium web驱动程序抓取web吗？如果是，你能给我提供一些链接或存储库，以便我学习吗？我被迫在我的抓取工作中使用php/Laravel，因为他们说php很容易在服务器上部署/执行来进行实时抓取。

浏览 19提问于2019-11-19得票数 0

2回答

我不能抓取每个链接内容的具体时间段从确实

python、selenium、selenium-webdriver、web-scraping、selenium-chromedriver

我是python和web scraping的新手。您的帮助我们将不胜感激。我在编程和练习方面是新手。我正在使用python和selenium进行web抓取。我正在试着从事实上抓取数据。目标是找到过去24小时内发布的所有工作，并刮刮外部链接，这是在工作详细信息页面上与链接文本“申请公司网站”，标题，公司，名称，位置，工作描述。我写了以下代码，但是它正确地获取了页面上的所有链接，然后当我试图打开每个链接时，它只打开了第一个链接。我怎样才能打开我一个接一个的链接。提前感谢，下面是我的代码示例： import time from selenium import webdriver from se

浏览 33提问于2020-07-15得票数 1

回答已采纳

2回答

Selenium Python跳过NoSuchElementException错误

python、selenium、selenium-webdriver、selenium-chromedriver

有一页，我的老师让我做的地方，我应该点击一个词，并匹配它的定义。屏幕上有30个单词，每次屏幕上只能有6个单词(定义是匹配的，所以总共只有1个)。我有一个包含所有单词和定义的数组，所以python可以为我匹配它，但是，如果数组中的第一个单词没有出现，代码就不能工作。我如何绕过这个错误？这是我的代码： term = ["fug,fuge", "duc,duce,duct", "ortho", "morph", "mot,mob,mov,cine,kine", "ible, able", "fle

浏览 0提问于2018-02-27得票数 2

回答已采纳

1回答

如何使用python selenium自动选择文本并保存到csv/excel

python、python-3.x、selenium-webdriver、web-scraping

我正在开发一个selenium web驱动程序应用程序，在该应用程序中，将自动打开一个网页，该网页包含一个表，所以我的下一个目标是，我想复制(抓取)该表的第一行，并必须保存为csv文件，以实现它，我必须使用它？请任何人帮帮我。代码： from selenium import web driver from web driver _manager. chrome import Chrome Driver Manager import time from selenium. web driver. chrome. options import Options web = web driver.

浏览 1提问于2021-09-07得票数 1

1回答

如何等待这个网站在Python中使用selenium加载？

python、selenium、selenium-webdriver

目前，我正在我的python抓取项目中使用beautifulSoup。但是，在我需要抓取的页面中，我需要与javascript元素交互。所以我被迫使用selenium (我不太熟悉)。到目前为止，这是我的代码： from selenium.webdriver import Firefox from selenium.webdriver.firefox.options import Options from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expec

浏览 0提问于2020-12-27得票数 0

回答已采纳

1回答

selenium或其他web刮刀工具对于从chrome到python脚本的数据刮取是必需的吗？

python、google-chrome、web-scraping

所以我想刮一个网站的数据。我在python脚本中使用selenium来抓取数据。但是我注意到，在Google的网络部分，Chrome可以记录XmlHttpRequest来查找网站的json/xml文件。因此，我想知道我能否在python脚本中直接使用这些数据，因为selenium很重，需要更多的带宽。selenium或其他web刮刀工具是否应该用作与浏览器通信的媒介？如果没有，请提供一些有关只使用chrome本身为我的python文件使用的刮取数据的信息。

浏览 0提问于2019-06-09得票数 0

2回答

在使用python的selenium中使用xpath获取innerHTML

python、selenium、xpath、css-selectors、webdriverwait

我正在尝试学习web抓取，尽管我检查了文档中的示例和堆栈中的一些问题，但我无法使我的代码工作。我想要抓取的网站有工作列表，但它的结构上没有模式或固定的类，几乎每个元素都有自己的id和单独的类。当我使用检查器从锚标记中查找innerHTML的xPath时，我得到的是：使用Firefox： /html/body/div[1]/div/main/div[3]/div/div/section/ul/li[1]/article/header/div/div[1]/h2/a 使用Brave Browser： //*[@id="16542952"]/section/div/header/

浏览 7提问于2020-05-19得票数 0

4回答

Python的新技术-一般Web抓取

python、web-scraping

为了学习更高级的Python，我要求自己创建一个定位到网站的python脚本(在本例中是imdb.com)，输入一个单词(已经声明为变量)，然后将前5个标题输出到数组中，然后输出到控制台。我的问题是:这样的事情可能吗？是否有使这成为可能的库/框架？如果可能的话，我该从哪里开始？Web抓取对我来说并不是什么新鲜事，但Python中的web抓取却是新的。我真正需要的是指引正确的道路。25分钟的谷歌搜索得到了一些模糊的答案，只是让我更加困惑。

浏览 11提问于2014-04-16得票数 0

回答已采纳

1回答

使用Python进行Web抓取，而无需加载整个页面

python、python-3.x、web-scraping、web-scraping-language

我刚用Python开始了几个web抓取项目。我目前使用lxml，Beautiful Soup和requests模块来抓取网页。我需要知道是否有任何方法可以只从网站获得我们需要的数据，而不是加载整个页面。requests模块执行GET请求并接收整个，bs4，lxml只过滤数据。我尝试过Selenium，但这也打开了浏览器，这不太适合工业项目。我对scrapy和splash一无所知。我也不是在寻找API key方法，它并不适用于所有地方。

浏览 28提问于2021-11-13得票数 0

回答已采纳

1回答

能够抓取静态网站而不是动态网站

python、selenium、selenium-webdriver、web-scraping

我想知道下一场来自ESPN的比赛的时间，你可以在ESPN上找到：https://www.espn.com/ (现在看起来是尤文图斯和AC米兰之间的足球比赛) 我有下面的python代码用于我的网络抓取： import requests from lxml import html from selenium import webdriver import chromedriver_binary driver = webdriver.Chrome() driver.get('https://www.espn.com/') tree = html.fromstring(driv

浏览 11提问于2020-06-13得票数 0

回答已采纳

1回答

有人知道如何通过在python中使用selenium进行web抓取来解决reCAPTCHA v2吗？

web、recaptcha、screen-scraping

我正在尝试在python中使用selenium进行web抓取，其余的代码都很好，我只需要解决最困难的reCAPTCHA v2

浏览 36提问于2021-06-26得票数 0

2回答

Selenium Python:单击JSON应用程序生成的链接

python、json、selenium

[艾德:也许我只是在问这个？不确定-- ] 我正在尝试使用Selenium (Python)通过超链接导航到web数据库中的页面。一个页面返回一个表，其中包含我希望Selenium遵循的超链接。但是这些链接不会出现在页面的源代码中。与感兴趣的表相对应的唯一html是指示该站点正在从方面搜索中提取结果的标签。在div中有一个<script type="application/json">标记和几个搜索选项。没别的了。同样，我可以在Firefox中查看超链接，但不能使用"View Page Source“或Selenium的selenium.webdrive

浏览 0提问于2015-04-29得票数 2

1回答

如何在docker容器中使用selenium设置python应用程序

python-3.x、selenium、docker

我目前正在做一个项目，用python构建一个web scraper，然后将其停靠，这样应用程序就可以在任何机器上运行。我已经构建了python应用程序，使用selenium加载我正在处理的网页。我不确定如何上传项目在docker与一个网络驱动程序(如geckodriver)，以便它可以运行。我是否需要使用应用程序创建一个容器，并将其链接到另一个selenium容器？谢谢你的帮助！我的代码从我编译的文本文件中获取邮政编码列表，并使用这些代码在地图上的特定位置抓取。抓取数据后，它会将数据附加到csv文件中。我需要它能够运行应用程序，然后将csv文件输出到主机。编辑:我以前从未使用过docke

浏览 14提问于2019-05-06得票数 9

回答已采纳

2回答

如何在python中实现网络抓取

python、selenium、web-scraping、beautifulsoup、mechanize

我对python刚开始在python上抓取。我必须从这个中抓取数据我需要根据的实体代理来抓取所有的详细信息op -state代理程序；对于web浏览器上的，我必须遵循下面的说明。转到单击“代理办公室”按钮，在“搜索”框中输入4000针，然后提交。然后我们得到了机构的名单。去我们的小组然后我们找他们的探员。然后，我们必须访问每个代理页面并记录它们的信息。任何人都可以告诉我如何处理这个问题。是制造这种刮板的最好方法。我是否必须使用selenium与页面进行交互。我使用BeautifulSoup完成了request、和简单表单提交的工作，并使用机械化完成

浏览 9提问于2017-10-09得票数 0

回答已采纳

1回答

如何使用python从whatsapp中提取qr代码？

python-3.x、selenium、web-scraping、data-extraction

我尝试过使用python和selenium提取qr代码，并且能够提取qr代码，但有时qr代码没有加载。 from selenium import webdriver from selenium.common.exceptions import NoSuchElementException from selenium.webdriver.common.keys import Keys from bs4 import BeautifulSoup browser = webdriver.Firefox() browser.get('https://web.whatsapp.

浏览 4提问于2020-01-12得票数 2

回答已采纳

1回答

如何在python语言中使用selenium和chromedriver抓取此页面？

screen-scraping

我正在尝试使用selenium和chromedriver从网站“”中抓取数据。当我运行代码时，chromedriver成功地输入了url，但无法加载页面，显示了一个空白页面。我尝试将目标网站切换到google.com，但抓取成功。我的结论是目标网站服务器检测到selenium并拒绝发送回数据。那么如何在Python语言中使用selenium和chromedriver从网站抓取数据呢？我是一个Python初学者，感谢您的帮助。下面是我的简单代码： from selenium import webdriver my_driver_path = r"C:\python chrome driv

浏览 0提问于2020-05-29得票数 0

1回答

可以在web应用程序中使用Selenium吗？

selenium

我正在建立一个在Django的网站，将从一些网站抓取数据，这样人们就可以进入该网站，设置自定义数据过滤器，并查看抓取的数据在友好的格式。问题是requests和beautiful soup模块不足以满足抓取目的，因为我还需要一些自动化操作(加载javascript或单击按钮)。由于Selenium要求下载webdriver并将其放入路径中，是否可以在web应用程序中使用它？比如在某个地方托管webdriver？我也对Selenium以外的解决方案持开放态度，如果有的话。

浏览 3提问于2018-07-01得票数 1

1回答

有没有任何快速的方法来刮一个有无限滚动的网站？

python、web-scraping

我正在尝试使用python来抓取一个用无限滚动实现的网站。实际上，网络就是pinterest。我知道如何使用selenium来抓取具有无限滚动的web。但是，WebDriver基本上模仿了访问web的过程，而且速度慢得多，比使用BeautifulSoup和urllib进行抓取要慢很多。你知道有什么时间有效的方法来刮一个无限滚动的网页吗？谢谢。

浏览 0提问于2014-12-29得票数 0

回答已采纳

1回答

基于动态内容和隐藏数据表的Selenium Web抓取

python、selenium、dynamic、web-scraping、beautifulsoup

真的需要这个社区的帮助！我正在使用Selenium和Beautiful Soup在Python中对动态内容进行web抓取。问题是，即使使用以下代码，也无法将定价数据表解析为Python： html=browser.execute_script('return document.body.innerHTML') sel_soup=BeautifulSoup(html, 'html.parser') 然而，我后来发现，如果我在使用上面的代码之前单击WebPage上的“查看所有价格”按钮，我可以将该数据表解析为python。我的问题是，我如何解析和访问我的py

浏览 15提问于2018-02-14得票数 2

1回答

使用窗口批处理运行Python Selenium的命令行窗口后，将其关闭

python、selenium、batch-file、command-line

我使用Python Selenium进行Web抓取，并使用批处理.bat文件触发它。chrome浏览器和命令行窗口在成功运行后仍会打开。它应该被关闭，因为我将exit放在了批处理脚本的末尾。请参见下面的代码 timeout /t 2 /nobreak "C:/Users/h/AppData/Local/Programs/Python/Python37/python.exe" "C:/Users/h/Desktop/Bbq/Python/Test.py" timeout /t 12 /nobreak exit 我看了cmd中的消息，这是屏幕截图 ? 我想知道

浏览 15提问于2020-06-17得票数 1

回答已采纳

1回答

Selenium中的Xpath通配符以捕获多个结果实例

python、selenium、xpath、web-scraping

我正在尝试使用Python、Selenium和Xpath从一个站点收集一些数据。我需要多个数据点，它们都在这个结构中： /tr[1]/td /tr[2]/td /tr[3]/td /tr[4]/td 我不知道有多少个<tr>，所以我试图以一种只给出所有结果的方式(希望在一个列表中)来搜索。这是我的实际代码，但这只是给我个人的结果。我刚接触过web抓取，也不确定这个问题是否与我的Xpath有关(没有正确地执行通配符，或者它是否与我的get_attribute标记相关--如果它正在获取innerhtml，那么它是只为单个条目获取的吗？) data = driver.find_elem

浏览 5提问于2014-04-04得票数 1

回答已采纳

1回答

Selenium PhantomJS等待映像可用

python、selenium、web-crawler、phantomjs、wait

我正在编写一个通用的基于selenium幻影的蜘蛛来访问和爬行网页。程序的输入包括需要爬行的模板(css选择器)，输出应该按照模板生成数据。如果我们尝试从一个网站抓取图像，有时我们可能会得到空图像(如果执行时的页面源不包括图像)，这可以由解决，然而，当网页为图像提供占位符时会出现更具有挑战性的问题，而这些占位符后来通过ajax请求被真实图像URL所替代。问题是，如何确保selenium只在其真正的URL包含到页面中之后才会抓取图像。我在考虑检查图像的src属性是否有变化，只有在进行了一次更改之后，我才开始解析页面源。但是，不确定如何实现这一点？或者这是个好主意？编辑 <html

浏览 2提问于2016-01-24得票数 1

回答已采纳

2回答

使用python scrapy抓取同一链接的下一页

python、selenium、scrapy

我想抓取链接的下一页：https://www.thetoptens.com/animals/，使用scrapy-selenium点击next按钮，但它抓取了链接的第一页。我也尝试过使用webdriver，但显示了相同的结果。使用scrapy-selenium的代码： import scrapy from scrapy_selenium import SeleniumRequest from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as

浏览 35提问于2020-12-17得票数 1

1回答

用测试“暂时性”DIV

python、selenium

我试图使用中的InternetExplorer驱动程序来自动化web应用程序。这个web应用程序通过显示一个包含旋转圆圈图标的“临时”DIV来显示结果。因此，如果我自动搜索web应用程序中的项，只要单击搜索按钮，DIV就会变得可见，然后在返回结果时消失。我知道DIV的类(“加载-指示符”)，我想知道是否有一种通过Python Selenium测试DIV变得可见的方法，然后测试DIV变得不可见作为触发后续活动的方式？

浏览 2提问于2016-12-13得票数 0

回答已采纳

1回答

硒--阻止某种元素出现

selenium、selenium-webdriver、web-scraping

我正在使用Selenium Firefox web驱动程序从某个网页收集数据。该网页包含子页面(例如，从1到100pg)，我正在遍历它们以抓取数据。但有时，网站会通过发送一个模式弹出窗口来意外地重置我在寻呼中的位置(如果我在第54页，我会突然返回到第1页)。我想知道是否有一种方法可以阻止这种行为--是否有一种方法可以阻止元素出现，或者阻止某种会导致这种情况的发送信号？

浏览 1提问于2016-09-04得票数 0

1回答

在Python中打印selenium webelement的HTML文本

python、selenium、beautifulsoup、web-scraping、urllib2

我正在使用Python中的Selenium webdriver进行web抓取项目。如何打印selenium.WebElement的HTML文本？我打算使用BeautifulSoup来解析HTML以提取感兴趣的数据。谢谢

浏览 19提问于2011-11-30得票数 5

回答已采纳

1回答

使用Scrapy和selenium抓取网站

python、selenium、scrapy

我打算用Scrapy在上抓取html内容。但是，由于站点的Javascript使用和#，我想我也必须使用Selenium (Python)。我想写我自己的代码，但我是编程新手，所以我想我需要帮助；我想先进入ntry.com，然后单击一个名为的锚点转到 <body> <div id="wrap"> <div id="container"> <div id="content"> <a href="/sco

浏览 2提问于2016-11-26得票数 0

2回答

漂亮的汤，在使用"findAll()“时完全匹配

python、html、selenium、beautifulsoup

我使用python (3.5)，selenium (3.6)和漂亮的汤(4.6)来抓取一个站点。用于查找某个html标记的im代码如下： descContainer=descContainers[0].findAll("div", {"class":"userHtml"}) 不幸的是，我不仅找到了我的目标div，它是： <div class="userHtml"> 但以下div的类名部分由感兴趣的类名组成： <div class="cept-threadUpdate-html toggleSect-hid

浏览 4提问于2017-12-12得票数 3

回答已采纳

1回答

我如何在Mac上解决这个Selenium异常，它显示"chrome不可达“？

python、selenium、web-scraping、selenium-chromedriver、chrome-web-driver

我正在尝试学习如何使用Selenium自动化web流程，并希望能够构建健壮的web抓取器和其他东西。所以，我刚刚安装完Pycharm和Selenium，我只是想运行一段简单的代码，在chrome中打开一个网页，并不是太花哨。我的代码如下(当然是用Python编写的) from selenium import webdriver PATH = "/Users/Kudzie/Tools/chromedriver" driver = webdriver.Chrome(PATH) driver.get('https://orbitrevolution.tech')

浏览 31提问于2021-05-18得票数 0

回答已采纳

2回答

Selenium.common.exceptions.NoSuchElementException错误即使有显式等待

python、selenium、web-scraping

，怎么了？我目前正在尝试从subreddit中抓取数据(我使用的是旧的reddit ->扩展名，它以这种方式恢复了reddit的旧外观，这样更容易抓取)，但是每当我试图获得结果时，我都会从这段代码中得到错误： xpath = "//a[@class='title may-blank loggedin ']" element = driver.find_element_by_xpath(xpath) selenium.common.exceptions.NoSuchElementException:消息:没有这样的元素:无法定位元素：{“方法”：“xpat

浏览 0提问于2021-02-06得票数 0

回答已采纳

1回答

如何在点击更多按钮后抓取网站数据

python、selenium、web-scraping、beautifulsoup

我正在尝试使用BS4 + selenium学习web抓取。网站链接为评论文本具有更大的跨度，单击该跨度时，使用AJAX将更多的文本加载到同一div中。但是我的代码在selenium单击More按钮之前输出了评论文本。如何使用selenium等待抓取更多按钮 from selenium import webdriver from bs4 import BeautifulSoup def openUrl(link): driver = webdriver.Firefox() driver.get(link) elem1 = driver.find_ele

浏览 4提问于2017-06-20得票数 0

1回答

Python + Selenium不检测元素

python、selenium、web-scraping

我刚开始在Python中使用Selenium，而且我在从web上抓取代码时遇到了困难。我不想让任何人帮我修好它。我正在寻找一只手，了解问题可能是什么，以便我可以继续。 # inicializar el paketito selenium from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait f

浏览 1提问于2017-07-14得票数 0

回答已采纳

1回答

我可以使用selenium来设置Microsoft仪表板中的日期吗？

python、selenium、web-scraping

我试着从公共 (第4页)中抓取数据。但不幸的是，我无法理解selenium是如何改变时间的。请告诉我，这是否有可能使用python + selenium？可以移动这些滑块，或者在输入中输入日期。谢谢。下面是加载仪表板页面的代码： from selenium import webdriver import time fp = webdriver.FirefoxProfile() url='https://app.powerbi.com/view?r=eyJrIjoiNjIwNzg5NzQtNzRlYS00YzFmLWJiNTUtOTM2MGEwY2FjOGJlIiwidCI6Im

浏览 7提问于2022-02-15得票数 0

回答已采纳

3回答

如何用Python使用Selenium从https://apply.workable.com/caxton中抓取职务公告？

python-3.x、selenium、xpath、text、webdriverwait

我正在尝试从这个网站上抓取工作帖子：，并在这个练习中使用Selenium和Python。以下是网站HTML中我所面临的问题：我试图到达<li>标记中的<main>标记，但是无法找到元素。当我试图使用XPATH、TAG NAME、CLASS NAME或CSS SELECTOR查找XPATH标记时出错。请看我的代码和下面的结果。在//div[@id = 'app']//div//div之前，情况似乎还不错，因为打印elem1会给出webdriver元素作为输出(请参阅下面)。请您建议我可以使用哪些代

浏览 17提问于2022-04-04得票数 1

2回答

如何在无头模式chrome python中从网站抓取实际数据

python、python-3.x、selenium、google-chrome、selenium-webdriver

from selenium.webdriver import Chrome from selenium.webdriver.chrome.options import Options from selenium.webdriver.common.keys import Keys opts = Options() opts.set_headless() assert opts.headless # Operating in headless mode browser = Chrome(executable_path=r"C:\Users\taksh\AppData\Local\Pro

浏览 26提问于2020-05-26得票数 1

回答已采纳

2回答

运行多个独立代码的Python

python、selenium、web-scraping、parallel-processing

我在代码中遇到了一个小问题。我有一个主函数，它在给定特定条件的情况下，必须启动一个或多个不同的函数来处理web抓取，特别是它们使用Selenium。问题是，我只是想启动这个web抓取“任务”，这只是一个简单的python函数，而不是等待它终止，而是让它独立于我的其余代码继续运行，这样我就可以独立运行同一函数的5个不同实例，而不是等待它们终止。一些伪代码： while True: condition = SomeComputation() if(condition): IndependentFunction( some_parameter ) 一旦调用了Inde

浏览 57提问于2021-02-25得票数 0

回答已采纳

2回答

如何将韩语作为参数放入Python - Selenium的find_element_by_link_text()中？

python、selenium、unicode

我在Python3.4中使用Selenium。我尝试将一个朝鲜语单词作为参数放入find_element_by_link_text()方法中，但不起作用。我的意思是，它没有创建任何错误，但它找不到任何文本是韩语的超链接。下面是一些示例代码： from selenium import webdriver browser = webdriver.PhantomJS() browser.get('www.certain-korean-web-page.com') a = browser.find_element_by_link_text('한국말') prin

浏览 3提问于2016-01-10得票数 1

2回答

Selenium Python页面更新后返回为空

javascript、python、selenium、scrape

我正在使用Selenium Python和BeautifulSoup来抓取数据。我需要的网站的html后，‘生活’按钮被点击。我正在获取要单击的按钮，但是新的HTML没有返回给我。我认为在按钮单击后，html会很快返回，所以我休眠了。但即便如此，它也只返回了类的空div 'Collapsible__contentInner‘。 from bs4 import BeautifulSoup from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.s

浏览 0提问于2020-08-24得票数 0

1回答

你能告诉我在python中没有反斜杠“\”，还有其他的可能性吗？

python、selenium-chromedriver

我的代码是基于浏览器自动化的selenium，web抓取。在这个概念中，我们需要给铬驱动程序路径。在windows中，路径使用反斜杠"\“。但是python不接受反斜杠。还有其他的可能吗？供您参考，我将我的代码和错误粘贴在下面。 from selenium import webdriver from quotes_page.overall_selenium import Alltags chrome=webdriver.Chrome(executable_path="C:\Users\ShanuMadhu\Desktop\python\chromedriver.exe"

浏览 2提问于2019-11-10得票数 0

回答已采纳

1回答

我不能单击一个项来使用python和selenium填充表单。

python-3.x、selenium

我对这两个Python都是新手，这是我第一次尝试Selenium。我的目标是使我在工作中放的一些罚单自动化。我使用的边缘，它似乎是建立的页面使用角。我开始选择我的选择，但无论我做什么，我都不能选择它，我已经在这里搜索了关于这个问题的其他帖子，并尝试了我能找到的所有解决方案，但它仍然不起作用。这是一张我走多远的照片。这是我的代码，我做错什么了？ from selenium import webdriver from selenium.webdriver.edge.service import Service from selenium.webdriver.edge.options i

浏览 3提问于2022-04-02得票数 0

2回答

如何使用selenium和Python查找包含特定文本的ng-repeater

python、angularjs、selenium

我有一个angular web应用程序，我想用selenium & python测试一下，html文件是这样的： <div ng-repeat="item in items"> <div ng-repeat="address in addresses"> bla </div> <div ng-repeat="address in addresses"> dodo </div> </div> <div n

浏览 1提问于2015-12-27得票数 1

2回答

是否可以使用Selenium WebDriver来驱动PhantomJS？

selenium、web-scraping、webdriver、phantomjs

我正在浏览Selenium WebDriver的文档，例如，它可以驱动Chrome。我在想，“驾驶”PhantomJS不是更有效率吗？有没有一种方法可以在PhantomJS中使用Selenium？我的预期用途是web抓取:我抓取的网站加载了AJAX和许多可爱的JavaScript，我认为这个设置可以很好地替代我目前正在使用的Scrapy Python框架。

浏览 4提问于2012-06-27得票数 35

回答已采纳