我有这个代码,从网页读取链接(网址),并将它们打印在屏幕上。
connection = urllib.urlopen("http://www.google.com")
dom = lxml.html.fromstring(connection.read())
for link in dom.xpath('//a/@href'):
print link
它工作得很好。
现在,我想做完全相同的事情,但是代替来自锚标签a的url,我想获得图片的url,它位于src下的img的HTML标签中。我不明白这个dom.xpath('//a/@href'
我正在尝试测试页面上所有href链接的超文本传输协议响应,使用WebDriver从页面获取所有链接,然后使用http.connect获取响应状态。
获取锚标签链接的代码片段:
List<WebElement> list = driver.findElements(By.cssSelector("a"));
for (WebElement link : list) {
System.out.println(link.getText());
}
但是我的页面有更多的href链接,这些链接没有锚标签<a>,并且可能驻留在页面主体之外的页眉部分。一些示例
在使用JQuery时,我对/page/部件有问题。
我有一个如果谁检查站点链接(link.get(0).href)与锚标签链接(location.href)。例如, = <a href="www.test.com/"></a>
一切正常,但在我切换到第二页的站点链接不匹配锚标签链接,那么有办法忽略这个/页/2部分吗?
以下是功能:
var link = $(this);
var url = link.get(0).href;
if (url === location.href) {
想象一下这个HTML:
<html>
<head><title>Nice page</title></head>
<body>Hello World <a href=http://google.com>This is a link</a>
<br />
<a href=http://www.google.com> this also
<img src=wrong.im
我使用SimpleHTMLDOM从其他网页抓取东西,但我有一个问题,如何才能在图像ancor标记内获得urls,因为该网页包含链接锚标记以及图像锚标记!但是我只想在图片锚标签的边上得到href的值!
<a href="I DO NOT NEED THIS VALUE"><a/>
<a href="I NEED THIS VALUE"><img src="xxxx"><a/>
但是当调用DOM时,它会返回所有的href URL,包括链接锚URL!我只需要在图像锚标签内的网址!
我使用这
不确定这是否可能。
尝试将属性选择器动态设置为当前目标(不使用任何JavaScript)。
类似于下面的css:
.tab[href=#:target] {
// styles here for active anchor tag
}
其中html (在Jade语法中)是:
.tab-group
a.tab(href="#tabA") Tab A
a.tab(href="#tabB") Tab B
a.tab(href="#tabC") Tab C
#tabA.target
.tab-content
h2 Tab A
#ta