前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >进一步防止 Selenium 被检测——如何防止浏览器用新标签页打开链接?

进一步防止 Selenium 被检测——如何防止浏览器用新标签页打开链接?

作者头像
青南
发布2020-04-28 10:48:31
4.2K0
发布2020-04-28 10:48:31
举报
文章被收录于专栏:未闻Code

摄影:产品经理

产品经理背着我吃日料

在文章:(最新版)如何正确移除Selenium中的 window.navigator.webdriver中,我们讲到了Page.addScriptToEvaluateOnNewDocument这个方法,它可以让当前标签页打开的所有网页,在网页内容加载之前执行一段 JavaScript 代码,从而防止网站检测到window.navigator.webdriver属性。

但有些网站,点击了它的页面超链接以后,会自动以新的标签页打开,这种情况下就无法使用上面提到的技巧了。

为了解决这个问题,我们必须设法让当前页面的所有a标签涉及到的链接,都能在当前标签页打开。

要解决这个问题实际上非常简单,我们只需要知道一点点HTML知识和 JavaScript 的知识即可。如果要用一个a标签的链接在当前页面打开,我们只需要设置它的target属性值为_self

现在我们需要用 JavaScript 把当面页面上的所有a标签的target属性值全部改成_self

以知乎为例,我们打开知乎的首页,如下图所示:

现在点击上面的任何一个问题,都会以新标签页打开,如下图所示:

现在我们回到原来的首页,打开开发者工具的Console选项卡,如下图所示:

执行如下两行 JavaScript:

代码语言:javascript
复制
let a_list = document.getElementsByTagName('a')
[...a_list].map(a => {a.setAttribute('target', '_self')})

运行效果如下图所示:

现在,我们再次点击页面上的任意一个问题,就会发现,你可以直接在当前标签页打开了。

使用这个方法有4个地方需要注意:

  1. 不适用于通过 JavaScript 的 window.open()函数打开新网址的情况
  2. 对于<form>标签的表单提交,也可以设置target="_self"属性。
  3. 必须等页面完全加载完成才能执行这两行 JavaScript 语句。如果执行语句以后,页面通过 Ajax 或者其他途径又加载了新的 HTML,那么需要重新执行。
  4. 每次打开新的链接以后,需要再次执行这两行语句。

这个方法可以与本文开始提到的那篇文章中的方法结合起来使用。首先通过Page.addScriptToEvaluateOnNewDocument让当前标签页的window.navigator.webdriver属性消失,等页面完全加载完成以后,再通过driver.execute_script()运行本文讲到的两行 JavaScript 代码,强迫网页在当前标签页打开新的链接。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 未闻Code 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云开发 CLI 工具
云开发 CLI 工具(Cloudbase CLI Devtools,CCLID)是云开发官方指定的 CLI 工具,可以帮助开发者快速构建 Serverless 应用。CLI 工具提供能力包括文件储存的管理、云函数的部署、模板项目的创建、HTTP Service、静态网站托管等,您可以专注于编码,无需在平台中切换各类配置。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档