div,在div前面添加两个斜杠即可
7 /html/body/div
8 //div
9
103)获取第二个div在div之前添加双斜杠并在后面添加数组并设值
11...//div[2]
12
134)获取最后一个div,在div前面添加双斜杠,后面数组内设置last()方法
14 //div[last()]
15
165) 获取有属性的div,在div前面添加双斜杠...,后面添加数组并设置@值
17 //div[@]
18
196)获取有id属性的div,在div前面添加双斜杠,后面添加数组并设置@id值
20 //div[@id]
21
227)获取...id属性值为d1的div,在div前面添加双斜杠,后面添加数组并设置@id='d1'的值
23 //div[@id='d1']
24
258)获取head下所有标签,在head前面添加双斜杠...三丶Pipeline:控制台、文件、定制输出
一般我们爬取的内容是不会放在控制台打印输出的,而是存储在磁盘空间或者是数据库中,下面通过代码来演示;
1package com.mobaijun;
2