最近有读者问我平时是怎么记录视频笔记的,因为陌溪之前一直沉迷于B站视频学习,在很多热门的视频下都留下我写的视频学习笔记,也成功帮助小伙伴们节省了很多时间,这次陌溪把压箱底的记笔记操作分享给大家。
在当今数字化时代,文字识别技术(OCR)已成为我们日常生活和工作中的重要工具。 OCR可以将图像或纸质文件中的文字转化为可编辑和可搜索的数字格式,为我们提供了便捷和高效的方式来处理大量的文本信息。
先说说我为什么要写这篇文章,在这之前,我遇到了一个问题,就是复制不了PDF的文字内容,而我偏偏又想获取到。 我尝试了很多办法,先是将PDF转成Word文档,这样就可以从文档中把内容复制出来了,但是这些格式转换的工具基本都收费,自然就不用再考虑了。 我还想过将要复制的文字部分截图下来,然后发到手机上,通过手机QQ的提取文字内容功能将文字提取出来然后复制:
当我们需要复制网页上的内容时,往往会碰到不能复制的情况,面对这个问题,不同的情况有不同的应对方法,比如禁止JavaScript运行,查看源代码,另存为网页文件等。这些方法也可以用,现在有个更通用的办法是QQ屏幕截图所带的功能,不管网页用的什么技术,能看见就可以复制,特别适合不太懂技术的人。
因为不同地方人们的使用习惯不同,国内可能截图更多的是使用QQ,微信等即时聊天工具提供的截图功能。所以我们竟然可能会遇到这样的场景:按了截图快捷键却发现并没有任何反应,尝试了多次才意识到 —— 没有开聊天软件。
我们平时听课、开会、学习都会记录一些重要的知识,这个时候我们要是手写记录的话,速度有可能会跟不上,有时还会错过重要的知识点。很多时候讲师都是使用ppt授课,这个时候要是有个工具帮我们解决这些问题就好了,我突然想到用小程来解决这个问题。
现在写文件很多网站都不让复制了,所以每次都是截图然后发到QQ上然后用手机QQ的文字识别再发回电脑。感觉有点小麻烦了,所以想自己写一个小软件方便方便自己,就有了这篇了:
如果是我们的视频,代码都是公开的,搜索下就可以找到。(比如上图中的代码在本次推文头条就可以找到文字版)
整体是用Python实现,所需要使用的第三方库包括aip、PIL、keyboard、pyinstaller,如未安装,可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller指令安装。
第一次写博客,只为分享一些学习上的心得,与大家共勉。今天给大家分享的主题是用百度的接口实现图片的文字识别。
https://itunes.apple.com/cn/app/id1243368435
可以搜本地安装的软件,本地的文件(夹)、浏览器的收藏夹、可以在alfred里搜索百度/谷歌/豆瓣图书等。
工欲善其事必先利其器,今天我给大家推荐一个非常简单,非常高效,非常好用的截图工具。没办法,我这个人就是看见好东西喜欢和大家一起分享。真心是忍不住要分享一下。 1 目标用户 对于一个经常写技术博客,在公众号分享技术的人来说,你们知道最大的难点在哪吗?在公众号分享文章,最大的难点是排版,而对于技术文章的排版来说,最难的在于代码的排版。所以我以前代码的排版经常使用截图,但是截图有点限制,没有找到合适的可以滚动截图的工具。代码如果超出屏幕长度,就不太好截屏了,以前用 windows 的时候,还有个可以滚动截图的,现
全称叫做optical character recognition,是对图像领域的文字进行识别。
在网上看到一些不错的文章或句子,想摘抄下来,结果网站添加了防复制功能,这时要怎么办呢?看着这些可望而不可及的资料内容,你着急不?
来源:大数据文摘本文约2000字,建议阅读5分钟800张图只要2分钟,程序已封装。 近日,根据复旦大学报道,学校信息科学与工程学院博士生李小康使用OCR和正则表达式帮助学院几分钟核查完数百人核酸完成截图,大大提高了核查效率和精度。 相关话题在知乎上也引起了众多讨论,目前该话题已经得到了300多万次浏览。 用OCR和正则表达式“防疫” 首先,我们需要简单介绍一些OCR。 OCR,英文全称Optical Character Recognition,即光学字符识别,也可简单地称为文字识别,这是文字自动输入的
import keyboard # 用于监控键盘按下,触发事件(pip install keyboard)
大数据文摘出品 作者:Caleb 上海尚未解封。 4月9日,在上海市疫情防控工作新闻发布会上,上海市副市长、市疫情防控工作领导小组副组长宗明表示,3月1日以来,上海市已持续开展了多轮次核酸筛查或抗原检测。 自4月4日上海宣布进行全员核酸检测以来,截至4月8日24时,累计筛查约9527万人次,已完成检测的样本中累计检出阳性感染者9.44万余人。 面对如此数量的核酸报告,人工核查核酸报告费时费力,高压之下些许错误也无法避免,有什么更好的办法吗? 4月7日,根据复旦大学报道,学校信息科学与工程学院博士生李小康
链接:https://pan.baidu.com/s/1VCZa_ho36jr_BuNSRgg-kQ
腾讯ISUX isux.tencent.com 社交用户体验设计 截图,是将显示设备上所展示的内容截取下来,所生成可视图像,截图的目的是为了保存特定状态下的界面内容。早在PC时代,大家在聊QQ时就会用QQ截图来分享自己所见,截图成为PCQQ非常经典的功能之一。 虽然PC系统本身就自带截屏功能,但是使用起来并不方便,只能全屏无法局部裁剪,编辑和保存路径也很长。QQ截图仅需要鼠标轻轻一框,就能快速截取自己想要范围的截图,马上分享给好友。QQ也持续针对截图体验做了深挖,不断完善截图能力:实时尺寸、
今天课代表就给大家盘点一下,那些在我的电脑上生存超过一个月甚至是超过两年的软件...当然,这是第一期。
课代表有一个烦恼,就是平时需要看的东西太多了,看到好的东西就想收藏起来,浏览器里看到?加个书签。QQ看到的?转发到小号。微信看到的?收藏。或者老师发来了要求,需要记住其中的一部分,久而久之,也就忘了都
1、最好用的就是大家耳熟能详的QQ,功能十分强大,功能齐全,最重要的他是免费的,不用会员就可以进行长截图,屏幕截图,屏幕翻译,屏幕识别(用来截取或者提取文字),甚至还可以免费录制屏幕,相信大家都有屏幕录制的需求吧,却苦于找不到免费的软件工具吧!!如果你看到了这篇文章,对你有所帮助的话,请关注本公众号或者打赏作者都可以的。
作为一个工具控,一直在社区索取别人的营养,今天在下将我搜集的一些应用贡献出来,推介二十几个我常用的软件。一些是其他人反复推介确实经典,另一些是我偶然发现但经过使用感觉非常好用,一并献上,大家可以根据自
作为一个工具控,一直在社区索取别人的营养,今天在下将我搜集的一些应用贡献出来,推介二十几个我常用的软件。一些是其他人反复推介确实经典,另一些是我偶然发现但经过使用感觉非常好用,一并献上,大家可以根据自己的需要,看看是不是正需要这些软件,并解决自己生产生活中的痛点。
现在办公自动化的普及,在办公室工作的人员在制作文案时,会使用到大量的资料,为了保存这些资料,很多人会使用拍照或者是扫描的方式,把内容通过文字图片保存起来,但是在进行编辑时,如果逐字敲成本文格式,会比较麻烦,也容易出错,这时就会遇到文字图片转为本文的情况,下面就来看看,文字图片能不能转换成word文档吧。
作者 Nandisec 选题背景 QQ蠕虫是一种利用QQ等腾讯公司相关产品进行传播的一种特殊蠕虫,该蠕虫的基本原理是利用了QQ帐户的快速登录机制,只要当前系统中有一个QQ帐户成功登录,就可以通过后台接口实现该帐户相关应用的快速登录而不需要再次输入帐户密码。登录后蠕虫可以访问QQ应用的各种网络接口,例如:通过接口实现加QQ好友、加入QQ群、发消息、发日志、发微博、上传群共享文件等操作,且完全不需要用户同意。借用这种技术,QQ蠕虫可以实现非常快速的传播。这种蠕虫诞生于QQ体系之上,其影响和传播主要集中在国
uTools 是一个极简、插件化的现代桌面软件,通过自由选配丰富的插件,打造得心应手的工具集合。
从QQ中提取出来截图功能,不需要注册登录,也没有任何的广告干扰,功能非常的强大,内置截图、录制、文字识别、翻译等等功能,是一款非常实用的工具!
近期受新冠疫情影响的地区,部分已经开始逐步复学啦!神兽即将归笼,然而却又愁哭了家长和老师们。 以深圳为例,返校前3天学生及同住人都需要提交健康码、行程卡、核酸检测记录截图,不仅家长们要每天和截图斗智斗勇,拼图上报、打包提交……各种要求挑战家长的动手能力;老师更要逐个家庭检查截图,还要手动统计上报“异”情,动辄好几十分钟就过去,这日子过得都要怀疑人生了。 现在,腾讯云、腾讯技术公益联合腾讯问卷推出疫情健康申报服务,在腾讯云微搭低代码能力的支持下,通过腾讯云AI的OCR文字识别技术,快速识别健康码、行程码、核
Android 的 UI 测试中,经常要点击某个控件,google 给出了 uiautomator 工具可以方便的查看控件信息,但是写测试用例的时候,仍然经常遇到控件无法获取或者不方便获取的情况,比如:
现在的科技日新月异,而随着信息获取的方式越来越多,门槛也越来越低,我们似乎早已进入了一个“开源”的世界。
最近去超市看到好多商户一个二维码同时支持支付宝、微信、QQ扫描付款,所以回来自己上网研究了一下。整理了一个现成的源码,有需要的朋友可以下载自己研究下。
最近答题类app比较火,玩了几把之后想到为什么不用技术来查找答案呢?因此搞了一款辅助app,能够帮助大家直接搜索答案.经过两天的开发和三天的测试,终于让我的冲顶率达到了80%左右,先上几个不错的战绩装
其中有关“鼠标控制class、OCR class、Python控制窗口”的代码片段,均是来自:
相信大家对PotPlayer并不陌生,因为视频拓展功能及兼容性十分突出,被很多技术大佬推荐,尤其是它可以导入直播源,几行网址就能让播放器秒变直播软件。该软件是为数不多的免费无广告,还长期维护的良心播放器。
截图功能想必大家在生活是比较经常用的。那么,你平时用哪些截图工具呢?用着是否高效,是否顺畅?是否使用QQ截图?
看到知乎,百度的页面 F12 检查后都会有一些有趣的招聘信息。于是乎我也想给我的博客加一个。 我主要用到的工具:
知晓程序员,专注小程序开发的程序员! 连胜老师给大家解读一下,昨天下午微信派公众号发布了一条公告:为避免过度营销造成对用户的骚扰,朋友圈内不允许发布及传播具有识别、标记功能的特殊识别码、口令类信息。
随着智能手机的普及,手机不断实现质的飞跃,你家里还能找到那台N年前风靡全国的大哥大和诺基亚吗?相信很多人家里都还有。后来智能手机的发展直接打破原有的平衡,直接让非智能机快速步入老人机行列。时间过的如此之快,科技发展的如此之快。这些年着实火了一把的苹果手机,是乔布斯带给世界的惊喜。更新换代之快,大家有目共睹。
对于web应用程序来讲,处于安全性考虑,在登录的时候,都会设置验证码,验证码的类型种类繁多,有图片中辨别数字字母的,有点击图片中指定的文字的,也有算术计算结果的,再复杂一点就是滑动验证的。诸如此类的验证码,对我们的系统增加了安全性的保障,但是对于我们测试人员来讲,在自动化测试的过程中,无疑是一个棘手的问题。 1、web自动化验证码解决方案 一般在我们测试过程中,登录遇到上述的验证码的时候,有以下种解决方案: 第一种、让开发去掉验证码 第二种、设置一个万能的验证码 第三种、通过cookie绕过登录 第四种、自动识别技术识别验证码 2、自动识别技术识别验证码 前三种解决方案,想必大家都比较了解,本文重点阐述第四种解决方案,也就是验证码的自动识别,关于验证码识别这一块,可以通过两个方案来解决, 第一种是:OCR自动识别技术, 第二种是:通过第三方打码平台的接口来识别。 OCR识别技术 OCR中文名称光学识别, tesseract是一个有名的开源OCR识别框架,它与Leptonica图片处理库结合,可以读取各种格式的图像并将它们转化成超过60种语言的文本,可以不断训练自己的识别库,使图像转换文本的能力不断增强。如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。那么接下来给大家介绍一下如何使用tessract来识别我们的验证码。 关于OCR自动识别这一块,需要大家安装Tesseract,并配置好环境,步骤如下 1)、安装tesseract 适用于Tesseract 3.05-02和Tesseract 4.00-beta的 Windows安装程序下载地址:github.com/UB-Mannheim… 2)、加入培训数据 tesseract 默认只能识别英文,如果您想要识别其他语言,则需要下载相应的培训数据 下载地址:github.com/tesseract-o… 下图为中文数据包 我们只做中文,暂时下载一个中文的文字训练数据就可以 ,然后将.traineddata文件复制到安装之后的’tessdata’目录中。C:\OCR\Tesseract-OCR\tessdata 3)、配置环境变量 要从任何位置访问tesseract-OCR,您可能必须将tesseract-OCR二进制文件所在的目录添加到Path变量中C:\OCR\Tesseract-OCR。 安装后tesseract之后 ,并不能直接在python中使用,我们要想在python中使用,需要安装pytesseract模块我们可以通过 pip 安装 pip install pytesseract python中识别验证码图片内容 安装好后。找一张验证码图片,如下图(命名为test.jpg),放在当前python文件同级目录下面, 使用 PIL中的Image中的open方法打开验证码图片,调用pytesseract.image_to_string方法,可以识别图片中的文字,并且转换成字符串,如下面代码所示。 import pytesseract from PIL import Image pic = Image.open(‘test.jpg’) pic 为打开的图片,lang指定识别转换的语言库 text = pytesseract.image_to_string(pic,lang=‘chi_sim’) print(text) 通过上述方法能识别简单的验证码,但是存在一定的问题,识别的精度不高,对于一些复杂一点,有干扰线的验证码无法正确识别出结果。 接下来给大家介绍一下第二种识别的方案,第三方的打码平台识别 打码平台识别验证码 第三方的打码平台相对于OCR来讲,优势在于识别的精准度高,网络上的第三方打码平台很多,百度随便一搜就有几十个,这个给大家列举几个,如下所示: 网络上的第三方打码平台众多,这里小编选择超级鹰这个第三方的平台来给大家做演示。 首先登录我们需要注册登录超级鹰这个网站 www.chaojiying.com,进入之后我们找到python对应的开发文档并下载, 下载开发文档 下载之后解压缩,得到如下文件 第三方打码平台的接口分析 我们打开chaojiying.py这个文件后,会发现这个文件中给出了的接口非常简单,如下所示 首先第一步创建一个用户对象:三个参数(账号,密码,软件ID),账号密码就是该网站的账号密码,那么软件ID呢?软件ID我们可以在用户中心找到软件ID,然后进去点击生成一个软件ID(如下图), 第二行代码就是打开一个要识别的验证码图片,并读取内容, 第三行,调用PostPic方法识别验证码,两个参数(验证码图片内容,验证码类型),关于验证码类型,请参考该网站的价格体系(如下图),根据验证码类型选择对应的数值传入。 结果提取: PostPi
给QQ好友随便发送一个截图,可以建立一个直接到对方电脑的Socket连接(因为QQ发送消息时候文字利用服务器转发,图片视频直接建立协议连接)
前几天,人民日报公众号报道了复旦博士生自己写代码,通过OCR和正则表达式统计核酸截图结果。具体文章见:https://mp.weixin.qq.com/s/l8u9JifKDlRDoz32-jZWQg
博主已经习惯了用QQ(目前是用TIM)截图,可以自定义大小,可以涂鸦,可以写字,不得不说腾讯在办公方面还是做的挺好的! 但是忍不了的是,每次保存图片时,都有个傻傻的前缀(QQ截图20170505163656.png|TIM截图20170505163656.png) 今天给大家带来的是自定义截图名称前缀 教程开始: 1.打开QQ或者TIM的安装目录(找不到的可以右键点击桌面的QQ图标,选择“打开文件所在的位置”,然后会打开QQ/bin文件夹,我们向上一个文件夹就是安装目录了)如下图: [caption i
我有个习惯,微信里看到的好文章都喜欢发给自己,然后有空的时候来看,但经常发现几天前的文章要不作者删了,要不被投诉删了。
平常截图都是用微信或者qq,自带的快捷键win+shift+s 可以不规则截图 。
领取专属 10元无门槛券
手把手带您无忧上云