我有一个网页,其中包含一个表1行,它包含一个链接。我想得到链接的href。
<table class="Table__table___3G1SW">
<caption>My Cpation</caption>
<colgroup><col class="Table__col-12___1AM3h"></colgroup>
<thead>
<tr><th scope="col"> Name, XYZ, Hel</th></tr>
</thead>
<tbody><tr><td><div><div><a href="/staff/312577">
<div><!-- react-text: 535 -->KLMNOP<!-- /react-text --><!-- react-text: 536 -->,<!-- /react-text --><!-- react-text: 537 --> <!-- /react-text --><!-- react-text: 538 -->ABCDEF<!-- /react-text --><!-- react-text: 539 --> <!-- /react-text --><!-- react-text: 540 -->B<!-- /react-text --></div></a></div><p>HOMNTH & XYZ</p><div><div><div>LLLMMMNN</div><div></div><div><!-- react-text: 547 -->NEW GBEL,<!-- /react-text --><!-- react-text: 548 --> <!-- /react-text --><!-- react-text: 549 -->NP<!-- /react-text --><!-- react-text: 550 --> <!-- /react-text --><!-- react-text: 551 -->085362!-- /react-text --></div></div></div></div></td></tr>
</tbody>
</table>
我想要获取/staff/312577
的值,并且我尝试使用xpath,但没有成功
elm = browser.find_element_by_xpath('//table[@class="Table__table___3G1SW"]//a[]')
我知道我犯了一个错误,因为我没有指定href的值,但是我不确定如何隔离a
的值。
发布于 2018-06-12 03:50:08
试试这个我认为它会起作用的,你在xpath
的末尾有一个错误,需要是//a
而不是//a[]
,并且在这个简单的使用get_attribute()
方法之后
elm = browser.find_element_by_xpath('//table[@class="Table__table___3G1SW"]//a')
print(elem.get_attribute('href'))
输出
'/staff/312577'
发布于 2018-06-12 03:52:14
要提取员工属性的值,即/ href
/312577,您可以使用以下定位策略
myText = driver.find_element_by_xpath("//table[contains(@class,'Table__table___')]/caption[contains(.,'My Cpation')]//following::tbody[1]/tr/td//a").get_attribute("href")
https://stackoverflow.com/questions/50804438
复制相似问题