前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >多窗口下的批量操作脚本 - 利用win3

多窗口下的批量操作脚本 - 利用win3

作者头像
py3study
发布2020-01-15 17:01:31
2.2K0
发布2020-01-15 17:01:31
举报
文章被收录于专栏:python3python3

环境:python 3.7.x

使用的模块:pyautogui, win32gui

使用的工具:WindowSpy++

背景:最近要用帮同学处理400+张图片的文字识别,考虑用python实现 [天若OCR] 的批处理,临时抱佛脚学了一些东西,过程磕磕绊绊的,就记录一下。

1. 鼠标键盘动作模拟的模块(包)选择

百度到的键鼠模拟包主要有PyUserInputpyautogui两个包可选,具体如下:

  PyUserInput: 集成了py3.x之前的pymouse和pykeyboard等模块,需要先安装pyHook环境,之后可以pip install PyUserInput

  pyautogui:  windows下可直接pip install pyautogui

两者都可以实现丰富的键鼠操作,但我在尝试UserInput的时候遇到了一些问题:不同系统的键盘名称有区别,但不太好找到windows对应的键盘名称表。

多次尝试无果后,我就选择了pyautogui,它功能与UserInput无异、可以直接使用pip安装,还能很方便地找到一些函数和按键的快查表(如 https://blog.csdn.net/ibiao/article/details/77859997 - "pyautogui (一)")。

* 在使用pyautogui的过程中,我遇到了一些问题,如反复使用pyautogui.hotkey('ctrl','v')来模拟Ctrl+V热键的时候,有一定的概率出错。我的解决方式是十分笨拙的手动模拟:

代码语言:javascript
复制
1 import pyautogui as pg
2 
3 pg.keyDown('ctrl')
4 pg.press('v')
5 pg.keyUp('ctrl')

2.多窗口下切换前置窗口

本着少做调查研究的原则,我本来是打算用模拟键盘alt+tab的方法直接实现切换窗口的,甚至计算了多个窗口下置换前置的排列组合方法。但是……天若OCR是一个联网才能使用的工具,在 [识别 - 跳出结果窗口] 的时间里,窗口的排列顺序是不确定的,所以多次反复的tab下结果总是不稳定……于是最终还是使用了win32。

论坛里关于使用win32将需要的窗口前置以方便模拟操作的攻略很少,这也是我写这一篇的动机。其实有非常简单的实现方法:

  ①确认需要前置的窗体信息:

    告诉win32前置窗体之前,我们需要得到这个窗体的信息。各种论坛中获取窗体信息的方法主要有使用win32的代码、使用WindowsSpy++、使用按键精灵等。尝试后我觉得WindowsSpy++是最好入门的。这是一款安装和使用的傻瓜机器,点击窗体就能直接看到窗体句柄(窗体的ID)、窗体标题、窗体类名等等信息。窗体句柄和标题(比如图片查看器)是经常会变动的,网友们有各种各样的方法来实时获取窗体句柄,而这里我…………为了偷懒,在窗体关系并不复杂的前提下,我选择了用窗体类名而不是句柄或窗体标题来直接区别不同窗体

    如批量OCR过程中需要前置操作的窗口有[图片查看器]和[文本编辑器],通过WindowsSpy++我得到:记事本的窗体类名是notepad,而Windows照片查看器的窗体类名是Photo_Lightweight_Viewer。

  ②使用win32前置窗体:

    如定义函数,前置[图片查看器]的代码如下:

代码语言:javascript
复制
1 import win32gui
2 
3 def fore_text():
4     #描述类名
5     cla = 'Notepad'
6     #利用方法,通过类名找到窗体句柄
7     ctjb = win32gui.FindWindow(cla,None)
8     #利用方法,通过窗体句柄前置窗体
9     win32gui.SetForegroundWindow(ctjb)    

*  win32gui.FindWindow()函数的信息如下:

(转载自https://blog.csdn.net/guangyinglanshan/article/details/77847952,"如何利用Python和win32编程避免重复性体力劳动(一)——开始、FindWindow和FindWindowEx")

3.案例的程序实现

虽然折腾了很久,但这个批量应用天若OCR的小脚本最后显得非常简单……具体代码如下:

代码语言:javascript
复制
 1 import pyautogui as pg
 2 import time
 3 import win32gui
 4 
 5 pg.PAUSE = 1.0
 6 
 7 #window ranges
 8 def fore_picView():
 9     cla = 'Photo_Lightweight_Viewer'
10     hld = win32gui.FindWindow(cla,None)
11     win32gui.SetForegroundWindow(hld)
12 
13 def fore_text():
14     cla = 'Notepad'
15     hld = win32gui.FindWindow(cla,None)
16     win32gui.SetForegroundWindow(hld)    
17 
18 
19 ## make sure TianRuo is open
20 
21 ###########
22 fore_picView()
23 
24 for i in range(0,100):
25 
26     
27     #F4
28     pg.press('f4')
29 
30     #choose rec
31     pg.click(650,400)
32     time.sleep(2.0)
33 
34     #change window
35     fore_text()
36 
37 
38     #Ctrl_V
39     pg.keyDown('ctrl')
40     pg.press('v')
41     pg.keyUp('ctrl')
42     pg.press('enter')
43     pg.press('enter')
44 
45     #change window
46     fore_picView()
47 
48     pg.press('right')
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-06-09 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 鼠标键盘动作模拟的模块(包)选择
  • 2.多窗口下切换前置窗口
  • 3.案例的程序实现
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档