使用Selenium和Python从xpath不断更改的元素中抓取文本

文章/答案/技术大牛

发布

1回答

、

我正在尝试从不同的网页列表中抓取信息。我能够从站点中抓取列表，并且我可以很好地迭代列表。我遇到麻烦的地方是提取一些文本，这些文本可能会在每个页面上找到，也可能找不到。最初，我使用的是xpath，这在一开始是有效的。但是后来xpath发生了变化。我以为我已经解决了这个问题，但我发现同样的信息还存在另一个xpath。现在，我认为<e

浏览 25提问于2020-07-02得票数 0

回答已采纳

1回答

selenium从网站中将内容抓取到数组中

、、、

我对从网站上抓取内容并将其放入数组感兴趣。具体来说，我感兴趣的是通过识别纯文本所在的html元素，将纯文本抓取到数组中。我正在与Java一起使用selenium，我希望有人能够了解一下实现这一目标的最佳方法。我将扫描多个纯文本元素，并将它们按顺序排列到一个数组中。纯文本将在html表中，我需要获取表中<

浏览 0提问于2015-05-11得票数 0

回答已采纳

1回答

Python/selenium网络抓取

、

review_dict = {}size = driver.find_element_by_xpath我担心的是：我正在尝试抓取一个网站。我正在使用selenium/python从跨度中剔除“501to1000名员工”和"Biotech &制药“，

浏览 10提问于2017-07-30得票数 1

回答已采纳

3回答

使用Selenium* Webdriver PHP选择元素？*

、、

我希望使用Selenium Webdriver PHP将许多页面元素存储在一个变量和循环中。例如：< cite > Name 2 < /cite >我使用了下面的代码，但是它没有给我上面的结果我如何使用Selenium Webdriver从元

浏览 0提问于2013-10-22得票数 1

2回答

根据div类中的属性值查找selenium中的元素

、、、、

我在Python中使用selenium来尝试和刮取多个页面。ID和XPATH的每个页面不断变化，所以我认为最好通过它们的属性值组合来访问它们(参见下面)。我试图访问以下元素中的文本：，它属于以下内容：正如我说过的，ID不断变化，所以我想通过数据片段名称=“articleDetail”或数据-=“文章体”来访问元素</e

浏览 7提问于2022-09-13得票数 -2

2回答

在使用python的selenium中使用xpath获取innerHTML

、、、、

我正在尝试学习web抓取，尽管我检查了文档中的示例和堆栈中的一些问题，但我无法使我的代码工作。我想要抓取的网站有工作列表，但它的结构上没有模式或固定的类，几乎每个元素都有自己的id和单独的类。当我使用检查器从锚标记中查找innerHTML的xPat

浏览 7提问于2020-05-19得票数 0

2回答

Selenium.common.exceptions.NoSuchElementException错误即使有显式等待

、、

我目前正在尝试从subreddit中抓取数据(我使用的是旧的reddit ->扩展名，它以这种方式恢复了reddit的旧外观，这样更容易抓取)，但是每当我试图获得结果时，我都会从这段代码中得到错误： xpath:消息:没有这样的元素:无法定位元素：{“方法”：“xpath”，“选择器”：“//a@class=‘title

浏览 0提问于2021-02-06得票数 0

回答已采纳

3回答

如何使用Selenium单击包含特定文本的类

、、、、

="mat-line">Text1</h3> 有很多类=“many”的链接，但是我想点击包含Text1的链接，怎么做呢？

浏览 1提问于2020-11-26得票数 1

2回答

如何使用Selenium和Xpath在超链接之前和之后获取文本

、、、、

我正在试图找到使用Xpath/Selenium的情况，在超链接之前没有空白。this<a href="#">link</a>to access the data</p>`问题:定位所有<a>元素有什么优雅的方法可以在锚之前/之后得到文本吗？我正在考虑使用X

浏览 8提问于2022-05-03得票数 0

2回答

NoSuchElementException:错误:无法定位元素：{“”：“xpath”，“选择器”：“//td@class=‘C($primaryColor)W(51%)’}”(会话信息: chrome=77.0.3865.120) from selenium import webdriver from selenium.webdriver.common.keys import Keysdriver = webdriver.Chrome('/U

浏览 6提问于2019-10-17得票数 0

回答已采纳

1回答

等待硒中的所有元素

、、、

我想从一个网站中检索每个div =‘abcd’元素，同时使用Selenium，以及'waiter‘和'XPATH’类，从显式中检索。当我运行下面的代码(Python)时，结果我只得到了“东西”。我想迭代div =‘abcd’的每个实例，这些实例出现在网站的源代码中。from explicit import waiter, XPATH from

浏览 0提问于2020-06-14得票数 0

回答已采纳

2回答

selenium抓取在前几个元素后返回空字符串

、、、

我正在使用python中的selenium抓取一个网站。xpath能够找到包含搜索结果的20个元素。但是，该内容仅对前6个元素可用，其余元素为空字符串。结果的所有页面都是如此results = driver.find_elements_by_xpath("//

浏览 3提问于2017-03-03得票数 3

1回答

用Selenium抓取Instagram点赞

、、、、

我正在尝试用Python和Selenium从instagram上抓取点赞信息。我有以下情况： ? 我想刮掉"63“这个数字。我有以下源代码(带有inspect)。 ? 我多次尝试用selenium抓取数字"63“：按类名、按xpath…… 例如： Likes=browser.find_element_by_xpath("xpath").text 在本例中<

浏览 8提问于2020-04-19得票数 0

1回答

如何在XPath中选择空元素？

、

我们使用Django 1.4测试和Selenium选择元素，如下所示： self.assertEqual(1, len(self.selenium.find_elements_by_xpath("//a问题是，有时有些元素没有文本，如果我们用[text()='']进行选择，它就会失败( len是0)。如何选择没有文本的元素？Update：因为[tex

浏览 5提问于2014-05-21得票数 7

回答已采纳

2回答

通过从列表中获取元素来更改xpath

、、、

我正在做web抓取，并尝试使用xpath和selenium进行抓取。只需更改我存储在列表中的内容，就可以更改xpath。我想创建一个循环，它可以自动更改xpath并查找内容。"EVENINGS_AND_WEEKEND_EXTRA", "ANYTIME_EXTRA"] name=

浏览 44提问于2017-07-28得票数 2

回答已采纳

1回答

如何使用绝对xpath从HTML中获取类名

、、

在下面的图片中，黄色高亮显示的HTML的完整xpath是 /html/body/bx-site/ng-component/div/sp-sports-ui/div/main/div/section/mainsp-coupon/sp-multi-markets/section/section/sp-outcomes/sp-two-way-vertical2/ul/l

浏览 4提问于2021-05-28得票数 0

回答已采纳

4回答

如何在Python中使用Selenium* WebDriver获取文本*

、

我正在尝试使用Selenium WebDriver获取文本，下面是我的代码。请注意，我不想使用XPath，因为在我的情况下，ID在每次重新启动网页时都会更改。我的代码：HTML： <span class=

浏览 63提问于2014-01-08得票数 111

回答已采纳

3回答

用于web抓取的Selenium与BeautifulSoup

、、、

我正在使用Python从一个网站上抓取内容。首先，我在Python上使用了BeautifulSoup和Mechanize，但我看到网站上有一个通过JavaScript创建内容的按钮，所以我决定使用Selenium。既然我可以通过像driver.find_element_by_xpath这样的方法使用Selenium查找元素并获取它们的</

浏览 1提问于2013-07-03得票数 53

回答已采纳

1回答

使用selenium在网页上的两个文本值之间选择元素

、、、

我正在尝试从中抓取文本值。我对同义词节感兴趣，但是在整个网站中使用的标记也用于其他部分。我目前正在尝试获取“同义词：”下面的元素和“文章”上面的元素，因为这是我认为可以隔离这一节的唯一方法。synsection = driver.find_elements_by_xpath("*[following::div[text()='Synonyms:'] and preceding::div[text()=&

浏览 2提问于2020-03-31得票数 1

回答已采纳

1回答

使用Xpath从此Etsy产品列表页面中抓取链接和描述

、、、、

我试图抓取上的所有链接，然后从每个链接中提取产品描述。问题:找不到链接的正确xpath。要获取该网页上的链接的xpath并从中提取产品描述，应该如何设置？有没有办法只使用</

浏览 18提问于2018-03-03得票数 0

点击加载更多