前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >利用爬虫抓取新理念英语答案

利用爬虫抓取新理念英语答案

作者头像
Innei
发布2021-12-28 15:40:16
4130
发布2021-12-28 15:40:16
举报
文章被收录于专栏:静之森

在此之前,在他人的博客中看到一篇文章

新理念外语网络教学平台——获取任意答案

,但是写得不是很详细,下面我来详细的说明一下.

原理

首先进入自己学校的平台.打开开发者工具--network,然后登陆

tva2.sinaimg.cn/large/006tNbRwly1fwzr01vvpsj31kw0xqaud.jpg)

图片加载失败
https://ws2.sinaimg.cn/large/006tNbRwly1fwzrwiaiogj30zo0es76o.jpg
https://ws2.sinaimg.cn/large/006tNbRwly1fwzrwiaiogj30zo0es76o.jpg

可以看到headers和data.并且data中的tbName和tbPwd都没有加密.这是之后我们需要post的 包括上面两个_

答案从哪来

如果你此前做过测试并且获得过60分以上的成绩,就可以查看那个习题答案.

我们打开开发者工具-- network.然后查看答案.

我们发现

图片加载失败
https://ws2.sinaimg.cn/large/006tNbRwly1fwzrwm5kldj31kw0xq7w2.jpg
https://ws2.sinaimg.cn/large/006tNbRwly1fwzrwm5kldj31kw0xq7w2.jpg

答案是通过viewTestTask.apsx获取的.其中data中三个数字就代表返回给viewTestTask.aspx来获取测试的答案.

那么我们就需要 获取这三个数字.

如何获取三个关键数字

首先我们需要进入本周测试的网页.

然后打开开发者工具--network

抓取

通过viewTestTask.aspx传入header和data进行抓取.

由于先人的代码会造成

UnicodeEncodeError: 'latin-1' codec can't encode characters in position 32-37: ordinal not in range(256)错误,我进行了二次修正.仅供参考.适合版本新理念英语v6.2

需要修改的地方已经标注. python版本3.7

实现全自动答题

准备

你需要安装Python3以上版本,并且正确安装Requests库,selenium库,Chrome以及对应的WebDriver。

除此之外你不需要做任何事。

开始

bash

代码语言:javascript
复制
1git clone https://github.com/Innei/Auto-AnswerXinLinian.git
2cd Auto-AnswerXinLinian
3python3 ./main.py
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018-11-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 原理
    • 答案从哪来
      • 如何获取三个关键数字
      • 抓取
      • 实现全自动答题
        • 准备
          • 开始
          相关产品与服务
          云开发 CLI 工具
          云开发 CLI 工具(Cloudbase CLI Devtools,CCLID)是云开发官方指定的 CLI 工具,可以帮助开发者快速构建 Serverless 应用。CLI 工具提供能力包括文件储存的管理、云函数的部署、模板项目的创建、HTTP Service、静态网站托管等,您可以专注于编码,无需在平台中切换各类配置。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档