前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Node.js识别图片验证码

Node.js识别图片验证码

作者头像
用户6256742
发布2022-07-06 14:59:19
3.9K0
发布2022-07-06 14:59:19
举报
文章被收录于专栏:网络日志

当我们使用无头浏览器做自动化爬虫时经常会处理到一些表单的自动填写,被爬取的网站当然也少不了验证码过滤,目前Web端常用的还是传统的图片验证码。我这里讲解一个Node.js识别图片验证码的Demo,是我在内蒙古高考报名志愿时候需要时候自动填写验证码时候做的测试。

环境安装

首先我们需要安装由Google开源的tesseract文字识别程序,下载地址,我用的是tesseract-ocr-setup-4.00.00dev.exe,下载后进行安装,直接一路Next就行,然后记住安装路径设置一下环境变量

Windows搜索框搜索:查看高级系统设置,点击环境变量,设置名称为TESSDATA_PREFIX的环境变量值为安装后的路径下面的tessdata文件夹

程序编写

我们使用tesseract.js插件来进行简单的图片验证码读取。可以读取本地的图片或者公网的图片。

图片地址:报名验证码地址

代码语言:javascript
复制
let Tesseract = require("tesseract.js")
Tesseract.recognize(
    'https://www1.nm.zsks.cn/kscx/public/addcode.do',
    'eng', {
        logger: m => console.log(m)
    }
).then(({
    data: {
        text
    }
}) => {
    console.log(text);
})
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 环境安装
  • 程序编写
相关产品与服务
验证码
腾讯云新一代行为验证码(Captcha),基于十道安全栅栏, 为网页、App、小程序开发者打造立体、全面的人机验证。最大程度保护注册登录、活动秒杀、点赞发帖、数据保护等各大场景下业务安全的同时,提供更精细化的用户体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档