文章/答案/技术大牛

发布

社区首页 >问答首页 >从span标记上方的文本节点获取文本

问从span标记上方的文本节点获取文本
EN

Stack Overflow用户

提问于 2020-11-11 16:00:26

回答 1查看 282关注 0票数 0

下面是一些我正在尝试使用python和selenium进行抓取的html。

<h2 class ="page-title">  
    Strange Video Titles
    <span class="duration">28 min</span>  
    <span class="video-hd-mark">720p</span> 
</h2>

下面是我的代码：

title=driver.find_element_by_class_name('page-title').text
print(title)

但是，当我运行它时，它会打印h2标记中的所有内容，包括span类中的文本。我尝试在末尾添加或添加1，以指定我只需要第一行文本，但这不起作用。我如何才能只打印视频标题，它位于跨类之上？

编辑-我认为这是的解决方案

所以我决定做以下几件事：

title=driver.find_element_by_class_name('page-title').text
duration = driver.find_element_by_xpath('/html/body/div/div[4]/h2/span[1]').text  
vid_quality =driver.find_element_by_xpath('/html/body/div/div[4]/h2/span[2]').text 


if (duration) in title:
    title = title.replace(duration, "")
if(vid_quality) in title:
    title = title.replace(vid_quality,"")

谢谢。

webdriverwait

python

selenium

xpath

css-selectors

Stack Overflow用户

发布于 2020-11-11 18:10:06

使用WebDriverWait()并等待visibility_of_element_located()

使用JS executor并使用firstChild获取标题值

element=WebDriverWait(driver,10).until(EC.visibility_of_element_located((By.CSS_SELECTOR,"h2.page-title")))
print(driver.execute_script('return arguments[0].firstChild.textContent;', element))

您需要导入下面的库

from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait

票数 1

查看全部 1 条回答

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/64789848

复制

相似问题

问从span标记上方的文本节点获取文本
EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从span标记上方的文本节点获取文本EN

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从span标记上方的文本节点获取文本
EN