生信修炼手册-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

生信修炼手册

专栏成员

877

文章

1899259

阅读量

184

订阅数

获取用户代理的多种方式

python 爬虫数据分析

用户代理可以将普通的爬虫请求伪装成浏览器发出的请求，从而绕过目标网站的反扒机制。获取用户代理，最基本的方式就是在自己的浏览器中进行查看，图示如下

生信修炼手册

2020-11-25

5220

初识scrapy爬虫框架

爬虫 scrapy python

框架是为了解决特定的业务场景而开发的一套高质量代码，通过框架避免了重复造轮子的低效模式，可以更加专注于具体业务相关的代码。在python中，scrapy就是一个主流的爬虫框架，可以通过如下方式进行安装

生信修炼手册

2020-11-09

3520

使用selenium自动化操作浏览器

数据分析 selenium 爬虫

selenium是一个浏览器自动测试工具，通过驱动程序来自动化操作对应的浏览器，包括了打开浏览器窗口，定位元素，点击按钮，上传文件等操作，支持以下多款主流浏览器

生信修炼手册

2020-11-02

9450

用户代理在爬虫中的应用

数据分析爬虫 html

用户代理对应的英文名称为User-Agent, 简称UA. 其具体内容为一行字符串，用来表征操作系统，浏览器版本等信息，以谷歌浏览器为例，通过快捷键F12的调试模式，可以看到浏览器在发送HTTP请求时的头文件，截图如下

生信修炼手册

2020-11-02

1.5K0

使用python urllib进行网页爬取

网站爬虫自动化 http

编写一段程序，从网站上抓取特定资源，比如自动化的下载kegg colorful pathway的通路图，这样的程序就是一个基础的网络爬虫了。在python中，通过内置模块urlib, 可以实现常规的网页抓取任务。

生信修炼手册

2020-05-28

1.8K0

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态