我不打算垃圾邮件,此外,谷歌已经使验证码与reCaptcha过时。我做这个项目是为了学习更多关于OCR的知识,最终可能是学习神经网络。
所以我有一张来自验证码的图像,我已经取得了一定的进展,但是关于tesseract的文档并没有很好地记录下来。这是我到目前为止的代码,结果如下所示。
from selenium import webdriver
from selenium.webdriver.common import keys
import time
import random
import pytesseract
from pytesseract import image_to_string
我正在尝试使用子进程从python内部的tesseract中读取验证码,但它给出了乱七八糟的输出
p = subprocess.Popen(['tesseract', 'CAPT1.png','stdout','-l','eng','--oem 3','--psm 7','>>','nm.txt'], stdout=subprocess.PIPE)
p.communicate()
Out : (b' \n\x0c', Non
如何提交包含Captch的表单?已尝试此代码
import urllib
import urllib2
from PIL import Image
import pytesser
#include the pytesser into the site pacakges
#and run sudo apt-get tesseract-ocr it is required by the
#pytesser to run the image converter
image = urllib.URLopener()
image.retrieve("http://www.stat.gov.
基本上,我工作的地方有一个提供OCR功能的系统。该过程是,第三方应用程序被配置为(在OCR过程期间)显示捕获的屏幕,并且用户坐在pc前确保捕获的数据是正确的。
此捕获阶段对每个字段进行验证。例如,如果文档是特定客户的发票,则发票的供应商将根据参考数据进行验证。验证码的形式是编译后的.net dll,它是由我自己从visual studio 2008解决方案生成的。
第三方接口用于捕获表单和我编写的代码之间的通信。一个例子是;
#region GetLinesTotal
/// <summary>
/// Gets the total for e.g. all VAT lines f
大家好,我有一个用java编写的代码,在net beans中运行得很好,但是当我想在eclipse中运行时,这个异常出现了。
Exception in thread "main" class com.aspose.ocr.internal.g: Culture Name: en-US-EN is not a supported culture
com.aspose.ocr.internal.aP.b(Unknown Source)
com.aspose.ocr.internal.aP.<init>(Unknown Source)
com.aspose.ocr.in
我正在研究硒。我正在做验证码。我正在手动放入验证码。代码应该是这样的:手动输入验证码,然后自动按Enter按钮。如果验证码是正确的,那么答对了!我们在下一页,工作已经完成/但是,如果它是错误的(在这种情况下,在按下Enter之后,应该有一个警告‘验证码是错误的’或类似的东西),然后使用driver.refresh()来刷新页面。我们从手动放置新验证码的第一步开始。然而,如果验证码是错误的,我不确定如何使用python来“查看”。在这种情况下,将使用if语句来刷新页面。在收到错误的验证码消息后,我尝试了下面这样的东西:
z = browser.find_element_by_name("
我正在尝试创建一个分数计算器;我的学生可以根据设定单位的成绩来计算他们的成绩。我进行了一次尝试,从下面的代码可以看出:
<script type="text/javascript">
var units = 3;
var ocr = 0;
var grade = "";
var feedback = "";
function runCert()
{
document.getElementById("o1").disabled=false;
document.getElementById("o2").d