首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用易语言写个简单的小爬虫其中的关键点

用易语言写个简单的小爬虫其中的关键点

作者头像
小小咸鱼YwY
发布2020-09-08 14:51:23
1.8K0
发布2020-09-08 14:51:23
举报
文章被收录于专栏:python-爬虫python-爬虫

一.请求头

ctrl+L快捷键创建变量

变量名

类型

协议参数

类_POST数据类

请求头数据

文本型

协议参数.添加 (“v”, “4.52.0”)

请求头数据 = 协议参数.获取协议头数据 ()

二.请求参数比如post

变量名

类型

请求data参数

类_POST数据类

请求data提交内容

文本型

请求data参数.添加 (“type”, “0”)

请求data提交内容 = 请求data参数.获取JSON文本 ()

三.进行请求

调用网页_访问S方法

.子程序 网页_访问S, 文本型, , 源码由[洫蜘蛛]提供,使用WinHttp的 API方式访问网页,如果返回是“?”请查询返回协议头是否有“Content-Encoding: gzip“表示gzip压缩过网页,可用 网页_GZIP解压()命令解压,如果返回是乱码,则返回原始文本,请自行转换编码,失败返回空文本,请取出状态文本。
.参数 网址, 文本型, , 完整的网页地址,必须包含http://或者https://
.参数 访问方式, 整数型, 可空 , 0=GET 1=POST 2=HEAD  3=PUT  4=OPTIONS  5=DELETE  6=TRACE  7=CONNECT
.参数 提交信息, 文本型, 可空 , POST专用
.参数 提交Cookies, 文本型, 参考 可空 , 设置提交时的cookie
.参数 返回Cookies, 文本型, 参考 可空 , 返回的Cookie
.参数 附加协议头, 文本型, 可空 , 一行一个请用换行符隔开,建议填写常量值或文本值,防止因传参引发错误
.参数 返回协议头, 文本型, 参考 可空 , 返回的协议头
.参数 禁止重定向, 逻辑型, 可空 , 默认不禁止网页重定向
.参数 网站登录用户名, 文本型, 可空 , 自动登录网页用户名 如路由器
.参数 网站登录密码, 文本型, 可空 , 
.参数 代理地址, 文本型, 可空 , 代理地址,格式为 8.8.8.8:88
.参数 代理帐号, 文本型, 可空 , 
.参数 代理密码, 文本型, 可空 , 
.参数 超时时间, 整数型, 可空 , 可以被省略,单位:秒,默认30秒,如果提供大于0的数值,则修改操作超时时间。
.参数 返回重定向, 文本型, 参考 可空 , 可以被省略,提供参数时只能提供文本型变量,用于当发生重定向时取回页面重定向的地址。
.参数 返回状态文本, 文本型, 参考 可空 , 
.参数 返回原始数据, 字节集, 参考 可空 , 可以被省略,返回原始网页编码
.参数 是否自动合并更新Cookie, 逻辑型, 可空 , 默认为真,自动合并更新
.参数 是否补全必要协议头, 逻辑型, 可空 , 当附件协议头为空时自动添加必要的UA协议头 默认为真,假将不再添加非传入协议头
.参数 字节集提交, 字节集, 可空 , 提交字节集数据
.参数 是否处理协议头大小写, 逻辑型, 可空 , 将协议头中的键名首字母处理为大写  默认为真

四.返回内容改成utf8编码

编码_utf8到gb2312(返回值)

五.展示效果图(涉及一些加密打码请谅解)

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2020-09-07 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一.请求头
  • 二.请求参数比如post
  • 三.进行请求
  • 四.返回内容改成utf8编码
  • 五.展示效果图(涉及一些加密打码请谅解)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档