首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
50 篇文章
1
Jmeter(一) - 从入门到精通 - 环境搭建(详解教程)
2
Jmeter(二) - 从入门到精通 - 创建测试计划(Test Plan)(详解教程)
3
Jmeter(三) - 从入门到精通 - 测试计划(Test Plan)的元件(详解教程)
4
Jmeter(四) - 从入门到精通 - 创建网络测试计划(详解教程)
5
Jmeter(五) - 从入门到精通 - 创建网络计划实战和创建高级Web测试计划(详解教程)
6
Jmeter(六) - 从入门到精通 - 建立数据库测试计划(详解教程)
7
Jmeter(七) - 从入门到精通 - 建立数据库测试计划实战<MySQL数据库>(详解教程)
8
Jmeter(八) - 从入门到精通 - JMeter配置元件(详解教程)
9
Jmeter(九) - 从入门到精通 - JMeter逻辑控制器 - 上篇(详解教程)
10
Jmeter(十) - 从入门到精通 - JMeter逻辑控制器 - 中篇(详解教程)
11
Jmeter(十一) - 从入门到精通 - JMeter逻辑控制器 - 下篇(详解教程)
12
Jmeter(十二) - 从入门到精通 - JMeter逻辑控制器 - 终篇(详解教程)
13
Jmeter(十三) - 从入门到精通 - JMeter定时器 - 上篇(详解教程)
14
Jmeter(十四) - 从入门到精通 - JMeter定时器 - 下篇(详解教程)
15
Jmeter(十五) - 从入门到精通 - JMeter导入自定义的Jar包(详解教程)
16
Jmeter(十六) - 从入门到精通 - JMeter前置处理器(详解教程)
17
Jmeter(十七) - 从入门到精通 - JMeter后置处理器 -上篇(详解教程)
18
Jmeter(十八) - 从入门到精通 - JMeter后置处理器 -下篇(详解教程)
19
Jmeter(十九) - 从入门到精通 - JMeter监听器 -上篇(详解教程)
20
Jmeter(二十) - 从入门到精通 - JMeter监听器 -下篇(详解教程)
21
Jmeter(二十一) - 从入门到精通 - JMeter断言 - 上篇(详解教程)
22
Jmeter(二十二) - 从入门到精通 - JMeter
23
Jmeter(二十三) - 从入门到精通 - JMeter函数 - 上篇(详解教程)
24
Jmeter(二十四) - 从入门到精通 - JMeter函数 - 中篇(详解教程)
25
Jmeter(二十五) - 从入门到精通 - JMeter函数 - 下篇(详解教程)
26
Jmeter(二十六) - 从入门到精通 - 搭建开源论坛JForum(详解教程)
27
Jmeter(二十七) - 从入门到精通 - Jmeter Http协议录制脚本(详解教程)
28
Jmeter(二十八) - 从入门到精通 - Jmeter Http协议录制脚本工具-Badboy1(详解教程)
29
Jmeter(二十九) - 从入门到精通 - Jmeter Http协议录制脚本工具-Badboy2(详解教程)
30
Jmeter(三十) - 从入门到精通 - Jmeter Http协议录制脚本工具-Badboy3(详解教程)
31
Jmeter(三十一) - 从入门到精通 - Jmeter Http协议录制脚本工具-Badboy4(详解教程)
32
Jmeter(三十二) - 从入门到精通 - Jmeter Http协议录制脚本工具-Badboy5(详解教程)
33
Jmeter(三十三) - 从入门到精通 - Jmeter Http协议录制脚本工具-Badboy6(详解教程)
34
Jmeter(三十四) - 从入门到精通进阶篇 - 参数化(详解教程)
35
Jmeter(三十五) - 从入门到精通进阶篇 - 关联(详解教程)
36
Jmeter(三十六) - 从入门到精通进阶篇 - 设置负载阶梯式压测场景(详解教程)
37
Jmeter(三十七) - 从入门到精通进阶篇 - 输出HTML格式的性能测试报告(详解教程)
38
Jmeter(三十八) - 从入门到精通进阶篇 - 命令行运行JMeter详解(详解教程)
39
Jmeter(三十九) - 从入门到精通进阶篇 - Jmeter配置文件的刨根问底 - 上篇(详解教程)
40
Jmeter(四十) - 从入门到精通进阶篇 - Jmeter配置文件的刨根问底 - 中篇(详解教程)
41
Jmeter(四十一) - 从入门到精通进阶篇 - Jmeter配置文件的刨根问底 - 下篇(详解教程)
42
Jmeter(四十二) - 从入门到精通进阶篇 - Jmeter配置文件的刨根问底 -番外篇(详解教程)
43
Jmeter(四十三) - 从入门到精通高级篇 - Jmeter之IP伪装和欺骗(详解教程)
44
Jmeter(四十四) - 从入门到精通高级篇 - Jmeter远程启动(本地运行+远程运行)(详解教程)
45
Jmeter(四十五) - 从入门到精通高级篇 - Jmeter之网页爬虫-上篇(详解教程)
46
Jmeter(四十六) - 从入门到精通高级篇 - Jmeter之网页图片爬虫-下篇(详解教程)
47
Jmeter(四十七) - 从入门到精通高级篇 - 分布式压测部署之负载机的设置(详解教程)
48
Jmeter(四十八) - 从入门到精通高级篇 - Jmeter监控服务器性能(详解教程)
49
Jmeter(四十九) - 从入门到精通高级篇 - jmeter使用监视器结果监控tomcat性能(详解教程)
50
Jmeter(五十) - 从入门到精通高级篇 - jmeter 之模拟弱网进行测试(详解教程)

Jmeter(四十五) - 从入门到精通高级篇 - Jmeter之网页爬虫-上篇(详解教程)

1.简介

  上大学的时候,第一次听同学说网页爬虫,当时比较幼稚和懵懂,觉得就是几只电子虫子爬在网页上在抓取东西。后来又听说写代码可以实现网页爬虫,宏哥感觉高大上,后来工作又听说,有的公司做爬虫被抓的新闻等等。一直以来,爬虫似乎都是写代码去实现的,今天宏哥心血来潮,试一下能不能不写代码实现网页爬虫了。因此今天文章的主题就是介绍一下 Jmeter 如何实现一个网页爬虫!这里宏哥以爬取博客园首页文章为例实战一下。

2.爬虫原理

Jmeter 的爬虫原理其实很简单,就是对网页提交一个请求,然后把返回的所有 href 提取出来,利用 ForEach 控制器去实现 url 遍历。这样解释是不是很清晰?下面宏哥就来简单介绍一下如何操作。

3.小试牛刀

1、首先我们根据爬虫原理需要对网页提交一个请求,就拿博客园来举例子实战一下吧!我们向博客园发起一个请求,如下图所示:

2、察看结果树,观察一下返回值可以发现中间有很多 href 标签 + 文字标题的 url,如下图所示:

3、宏哥现在需要把这些 url 提取出来,利用强大的正则表达式!如下图所示:

4、从上图可以看出,宏哥已经把需要的东西提取到了,现在宏哥添加一个正则表达式提取器,记得匹配数字填-1,意思就是把所有合适的 url 都取出来,如下图所示:

5、然后,宏哥加一个 debug 取样器,运行jmeter,查看一下是否真的取出来了我们想要的东西,如下图所示:

6、又或者我们在结果里面直接利用正则匹配一下,可以看到很多网页链接都被取出来了,如下图所示:

7、接下来我们需要动用到 ForEach 控制器了,利用这个控制器对所有取出来的 url 进行遍历触发。记得在控制器里面填入变量名称,也就是刚刚正则表达式里面的变量名,如下图所示:

8、在 ForEach 控制器下面再添加一个 http 请求,利用它去执行请求触发,如下图所示:

9、重新运行Jmeter后,我们可以观察结果了,见证奇迹的时候到了。观察结果我们发现所有匹配的 url 都被触发了,如下图所示:

10.修改HTML,可以更好的查看我们爬取到的文章,如下图所示:

到此,Jmeter之网页爬虫-上篇就结束了,是不是很简单?去实际操作一下吧!

4.小结

  注意正则表达式,宏哥开始的时候,没有那个问号,结果导致url中,会带有target一串东西,导致请求失败。还有就是https注意有个s否则也会失败的。宏哥宏哥这里只是爬取了博客园首页的文章,有兴趣的可以自己试一下,爬取第1、2、3页的文章。

  好了,关于网页爬虫就介绍到这里了,其实知道其原理后实现是相当简单的,下一篇宏哥介绍一下,如何爬取图片。

下一篇
举报
领券