前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >验证码识别100%?我飘了...

验证码识别100%?我飘了...

作者头像
Python进击者
发布2020-12-08 10:19:35
2.7K0
发布2020-12-08 10:19:35
举报
文章被收录于专栏:JAVAandPython君

大家好,我是Kuls。

在去年7月份写了一篇关于验证码破解的文章,其中我把代码也上传到了github上。

但是很多读者来加我微信说他们不会使用或者说程序报错等问题。

今天我来手把手带着大家通过我的代码来训练一个验证码模型。

这里我先给出github项目地址,如果方便,可以给我个star⭐️!

https://github.com/hellokuls/cnnyzm

1.熟悉项目结构

这里我给大家都标识出来了,首先你需要了解每个文件是干什么的,不然你就会像只无头苍蝇。

这里的每一个文件都很重要。

2. 使用前的准备

使用之前是需要你准备好你的数据集,那么怎么准备呢?

如果你是需要爬取A网站,那么你可以通过第三方库生成与A网站相同的验证码图片

你也可以直接爬取它的图片

但是我们需要注意的是,图片的命名中必须要有相对应的字母或者数字。

例如我上面这样

所以最好还是自己去生成对应的验证码。

数量集需要多少呢?

我每次训练都是使用了1万张以上的照片

基本的准备好了,我们如何来使用该项目呢?

3.修改项目

没错,确实需要修改

修改什么?

你的图片路径以及你的命名规则。

像上图这些地方,肯定是需要修改的。

其次,命名规则在哪里修改?

其中i变量就是该图片的名称(包括后缀),所以自己按照自己命名规则切割一下就行了。

4.开始训练模型

以上的工作都准备好后,我们就可以正式训练模型了。

直接运行train.py文件即可。

图片中红框内的数据可以按需进行修改

当你跑起来后就是这样的。

5.测试模型

这就非常的简单了

我们直接运行test.py文件即可。

一些问题

1.该项目使用的TensorFlow是版本几?

1.xxx

如果你使用的是2也可以,只需要将

代码语言:javascript
复制
import tensorflow as tf

替换为

代码语言:javascript
复制
import tensorflow.compat.v1 as tf
tf.disable_v2_behavior()

爆红线也不用管它。

2.训练出来的准确率高吗?

我认为主要看验证码的复杂程度,至少我训练出来的准确率有99%

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-11-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python进击者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.熟悉项目结构
  • 2. 使用前的准备
  • 3.修改项目
  • 4.开始训练模型
  • 5.测试模型
  • 一些问题
相关产品与服务
验证码
腾讯云新一代行为验证码(Captcha),基于十道安全栅栏, 为网页、App、小程序开发者打造立体、全面的人机验证。最大程度保护注册登录、活动秒杀、点赞发帖、数据保护等各大场景下业务安全的同时,提供更精细化的用户体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档