0 前言
某些时刻,因为个人数据不想泄露出去,所以需要伪造一下数据;也有使用爬虫的时候需要换一下 user agent ,一个用到旧会被发现,最后就是被封结尾。
1 个人数据
使用的是 faker 这个包,安装的过程直接省去。下面这段代码是生成简单的个人信息。
语言那可以自己选择,注释那只给出了常用的语言。
1.1 自己选择需要的数据
下面是运行结果,职位的本地化还稍微有所欠缺,哪怕选择了中文,工作职位还是英文的。
运行结果
1.2 生成简单的个人数据
如果不喜欢,或者闲麻烦,可以直接调用给出的方法生成简单的个人信息
代码运行后的结果就是这样
简单个人信息1.3 生成复杂的个人数据
如果觉得不够详细,可以想下面这样做。
复杂个人信息
还有很多的东西没有写出来,建议去阅读官方文档(官方文档是英文的)
2 爬虫 user_agent
运行爬虫的时候总会加上 user_agent,每一次都是找一堆 user_agent,然后堆在一起,最后用 random 随机选择一个。
不得不说,麻烦到爆炸,还让代码多出了一堆,既不美观,又显多余。
上面看到的代码是我精简 3 次后的结果,原来的代码有20行
现在只需用一下 faker 这个包,简简单单就可以弄出一堆的 user_agent 了
多种样式,能满足大部分需求。
官方文档那的介绍更加详细,建议多看看
3 相关说明
https://github.com/joke2k/faker
faker 的说明文档:
https://faker.readthedocs.io/
题图:Photo byHarli MartenonUnsplash
领取专属 10元无门槛券
私享最新 技术干货