00:00
好,朋友们,今天继续给大家更新发票识别的功能,如屏幕所示,今天给大家更新的功能呢,是如何只需要一行代码,把PDF格式的发票批量识别成我们Excel文件,识别出的Excel里呢包含我们发票上的所有信息,这样当我们手里有很多发票的时候,就不需要一张一张的录入了,提高我们的工作效率。好,我们来看这个功能呢,是对之前我们录制的一套课程。EDF OCR文字识别进行的更新,之前文字识别这套课程呢,我们已经在五一期间全部都更新完毕了,还没有看的朋友可以去看一看,这一期视频只讲这些新功能的使用方法,我们直接打开代码来进行说明,好首先呢,在置顶评论拿到我们本套课程所有的软件和代码,拿到之后打开我们的第6讲,因为之前的课程我们已经讲了5讲了啊,从软件的下载安装到代码的运行都是很简短很基础的功能。大家可以跟着做一做,这一讲呢,直接打开第6讲的代码,你会看到这样几行内容,在这里呢,我们修改的地方也不多啊,和前面的课程一样,你只需要修改三个参数,哪三个参数呢?我一个一个的给大家介绍,首先第1个是PDF文件的位置。
01:20
举个例子,我在程序员晚风的发票这个文件夹里有我要识别的发票,那我就点进来,然后呢,复制上面这个目录,把它填到我们第一个参数里面,大家注意啊,这个参数前面有一个小二和引号,后面有一个引号,大家不要把它给删除了,只需要修改。引号里面的内容。大家一定要注意啊,因为之之前的课程里有一些朋友把前面这个小R给删除了,删除了之后这个程序就不能成功运行了。好吧,大家把这里面的内容改成你自己的发票文件夹,和之前图片识别的效果一样,如果你只需要识别一张发票,就把后面填上那张发票的名字啊,比如说我要识别矿泉水这一个,我就把这个PDF的全名给它复制过来,填到这个位置,如果我需要识别的是这个文件夹下所有的发票,那你就只填这个文件夹就可以了。
02:24
啊,听过咱们之前课程的朋友应该都可以理解一样的用法。好吧,第二个呢,是我们发票的输出文件夹,比如说我想把它放到我们的识别结果这样一个文件夹下,那我就点进来,然后把这个文件夹复制过来,注意啊,这里只需要复制文件夹就行了,还是同样的,只需要修改引号里面的内容,不要把前面的小二和引号给弄丢了,如果弄丢了,请把它加上,而且必须是英文模式下的引号,不能是中文的引号。
03:01
好吧,因为咱们这些编程语言都是英文状态下进行开发的,好,这是第2个参数输出,大家这里注意呢,输入和输出文件夹必须是互相独立的,不能有相互包含的关系,好吧,也就是说我们识别结果不能指定在程序员晚风的发票里面,好不好,他俩一定要相互独立,好这是需要注意的点。第3个参数呢,在下面这里,这个参数呢,也是来自我们。前几讲课程的观众啊,他说呢,想在这里想在识别结果这里呢,增加一列叫做文件名,方便他后来呢,对我们识别结果再进行一个核对。所以呢,我们增加了这样一个参数,File name.那如果有的朋友他不需要这个文件名,你可以把这个参数改成false。也就是否的意思。好吧,你改成false之后,那它的输出结果就没有这一列了,好,你只需要修改这三个参数,其他使用方法和我们之前的课程都一样,比如说运行还是右键选择这个run,好吧,听到这里并且已经实现了这个效果的朋友,在弹幕里打个666好吧,没实现的朋友可以现在去试一试,然后再回来打666啊,有问题的朋友趁着这个功夫可以在评论区进行提问了,每一条提问我都会详细的回复,来咱们再回顾一下啊,这个功能使用一共有三个重点。
04:36
啊,除了这三个重点以外,使用方法和前面的课程都一模一样,来哪3个重点呢?第一个我们PDF目录在哪里,我们要自己修改啊,改成你自己的,拿到我们的代码之后,单张识别呢,你就在这后面加上你单张识别的发票的文件名,你是批量识别呢,你就只填写那个文件夹就可以了。
05:01
好吧,他会把这个文件夹下所有的发票都识别出来,无论你是PDF格式的还是图片格式的,细心的朋友肯定已经发现了,我们这个参数名都是一样的。对吧,我们这次只不过是支持了,增加了支持PDF识别。所以说你这个文件夹下,不论是PDF格式还是图片格式,我们现在都可以自动识别出来了。啊,这里听懂的朋友在弹幕里打个3。好吧,来第二个重点呢,是我的识别结果存放在哪里,这里呢,你只需要注意这个存放的位置不能在这个发票里面,好吧,不能在这个发票的文件夹里面。他们不能有包含关系,第3个呢,就是我们这次增加了一个文件名的功能,如果你这里填出。这个参数它就会增加一列,这一列的内容是这个发票。识别结果对应的文件名。啊,如果你这里填false呢?那和图片识别之前的图片识别结果是一样的,它就没有文件名。好吧,大家赶紧去试一试吧。如果本期视频对你的工作有帮助呢?欢迎大家给视频点赞,或者在评论区直接告诉我,这就是对我开发新功能最大的鼓励。
我来说两句