Python Selenium:如何从下拉列表中获取值?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (2)
  • 关注 (0)
  • 查看 (933)

我在Python中使用Selenium打开网页,并试图从特定的下拉列表中获取值列表。假设下拉列表的HTML代码如下所示:

<select class="mdc-select__input" name="nouveau-num" data-msisdn-loaded="0">                           <option value="" selected="selected"></option>
                     <option value="351 8320175">351 8320175</option>
<option value="351 8652736">351 8652736</option>
<option value="351 8783295">351 8783295</option>
<option value="351 8094085">351 8094085</option>
<option value="351 8861691">351 8861691</option>
<option value="351 8271705">351 8271705</option>
<option value="351 8970191">351 8970191</option>
<option value="351 8965848">351 8965848</option>
<option value="351 8353924">351 8353924</option>
<option value="351 8988158">351 8988158</option>
</select>

我想检索所有在<option>标签。我试着做一个browser.page_source,它返回网页的HTML源,然后执行正则表达式(类似于<option value="[0-9 ]*">但结果是空的。但是,出于某种原因,上面的HTML代码不在Selenium检索的HTML页面源代码中。我可以用不同的方式来处理这个问题吗?

提问于
用户回答回答于

你可以创建一个Select对象并使用循环遍历大量的选项。

例如:

from selenium.webdriver.support.ui import Select
selector = Select(driver.find_element_by_name("nouveau-num"))
options = selector.options
for index in range(0, len(options)-1):
    print(options[index])

我尝试了你提供的链接上的代码,似乎有延迟,直到下载的值被加载。另外我忘了选项有一个元素列表,所以你需要指定.text。最重要的是,它By.NAME似乎比工作更好find_element_by_name

这是更正后的代码:

from selenium.webdriver.support.ui import Select
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

dropdown = driver.find_element(By.NAME, "nouveau-num")

selector = Select(dropdown)

# Waiting for the values to load
element = WebDriverWait(driver, 
10).until(EC.element_to_be_selected(selector.options[0]))

options = selector.options
for index in range(1, len(options)-1):
    print(options[index].text)

使用此代码我收到以下结果:

351 8631174
351 8586821
351 8014561
351 8831839
351 8957001
351 8673968
351 8612034
351 8585995
351 8438130
用户回答回答于

根据这个出色的答案,使用Regex解析HTML绝不是一个好主意。

你最好用find_elements_by_css_selectorfind_elements_by_xpath

css选择器示例:

for tag in browser.find_elements_by_css_selector('select[name=nouveau-num] option'):
    value = tag.get_attribute('value')
    text = tag.text

扫码关注云+社区

领取腾讯云代金券