我能用ImageMagick得到单个字符的边界框吗？ - 腾讯云开发者社区

文章/答案/技术大牛

发布

正则表达式笔记

点号(dot) 单个任意字符 ^ 脱字符(caret) 行的起始位置 $ 美元符(dollar) 行的结束位置 | 竖线(bar) 匹配分隔两边的任意一个表达式字符组我的英语很差，记性又不好，总是搞混...，当然也会有匹配非单词边界的需求，如果你想查找包含 hi 的单词，试一试下面的表达式吧： hi\B 怎么样，简单吧，注意以上元字符匹配的是一个边界，而不是具体的字符。...一个很自然的想法是用下面的正则表达式来查找：u[^x] 不过遗憾的是，你很可能漏掉了部分单词，啊？是吗？我怎么没看出问题来呢？到底会漏掉什么样的单词呢？...呵呵，如果 you 这个单词出现在一行的末尾，试一试，你还能用这个表达式搜索出来吗？记住排除型字符组的意思是匹配一个未列出的字符，而不是不要匹配列出的字符。那么正确的做法是什么呢？...如：我想匹配点号，可是在正则表达式中，点号代表任意单个字符，这时候我们只需要在点号的前面加反斜杠就 OK 了，如下： \. 我们把这种形式称为转义。我们可以在任何元字符的前面加上反斜杠来匹配它自己。

1K2 0

卷积神经网络在图像分割中的进化史：从R-CNN到Mask R-CNN

王小新编译自 Medium 量子位出品 | 公众号 QbitAI 卷积神经网络（CNN）不仅能用来对图像进行分类，还在图像分割任务重有着广泛的应用。...图4：在图像分割中，其任务目标是对图像中的不同对象进行分类，并确定对象边界。卷积神经网络可以帮助我们处理这个复杂的任务吗？对于更复杂的图像，我们可以使用卷积神经网络来区分图像中的不同对象及其边界吗？...改善边界框现在，我们已经能在边界框中找到对象，但是还能缩小边界框来适应对象的真实尺寸吗？可以的，这就是构建R-CNN网络的最后一个步骤。...在R-CNN中，我们使用了卷积神经网络来提取图像特征，用支持向量机来分类对象和用了回归模型来缩小边界框，但是Fast R-CNN使用单个网络模型来实现以上三个功能。...这样单个网络就可以输出所需信息。整个模型的输入和输出分别为：输入：带多个区域建议的图像。输出：具有更紧密边界框的每个区域的对象类别。

1.8K5 0

您找到你想要的搜索结果了吗？

是的

没有找到

RepPoints：可形变卷积的进阶

首先通过RoI pooling得到池化后的feature maps，然后通过一个fc层产生归一化偏移量 ? (该偏移量可以转化为 ? )。单个bin的输出特征可表示为： ? ?...RepPoints Motivation 在目标检测任务中，边界框描述了目标检测器各阶段的目标位置。虽然边界框便于计算，但它们仅提供目标的粗略定位，并不完全拟合目标的形状和姿态。...将 RepPoints 转换为伪框 (pseudo box)。然后，计算转换后的伪框与 ground truth 边界框之间的差异。...从另一个角度来理解RepPoints：可形变卷积通过最后的分类分支和回归分支的监督，自适应的关注到合适的特征位置，提取更好的特征，但是我一直没想明白的是可形变卷积真的能够关注到合适的特征位置吗，可形变卷积的偏移量学习是非常自由的...，可能会跑到远离目标的位置，那么这些特征真的是有帮助的吗，这些问题一直困扰着我，我觉得可形变卷积的中间过程太模糊了，太不直接了，是难以解释的。

5771 0

用FreeSWITCH进行图像处理

好了，言归正传，说说我为什么选了这么多工具来处理图像。请听题：我的需求是，将我写的毛笔字底色处理成透明的，将黑色替换成需要的颜色，做在书的封面上。原始图像如下图。 ?...replace" wenji-3.png 找到文字上的一个点（方法有很多，我使用的是在Preview中打开图像，然后用矩形选择框从左上角选取区域，在移动鼠标的过程中就可以看到当前坐标，在此我们找到的点是...首先，ImageMagic在“抠图”（将底色变透明）时，由于背景明暗相差太大，需要很多次处理才能做得更好，但太多次数处理图像又会使图像质量变差，另外，我也不知道如何用ImageMagick处理颜色的层次...图中显示的是『文』字中间6%的情况。可以在不同的区域重复多次以便得到完美的效果。 ?...没有一个工具是完美的，但工程师总能找到合适的工具解决相应的问题。在看到此文之前，你是不是以为Preview只能用于看图，FreeSWITCH只能用于打电话呢？

9114 0

pdf到png再到mp4短视频：不需要工具，2个指令1键搞定

引言说一个不太常用的需求，就是你有没有想过，把电脑上珍藏多年的PDF电子书，转换成视频文件，让大家学习。为什么要视频，电子书不香吗？不香！...学习时间有一种快速方便的方法可以将PDF转换为一个或多个图像。命令行工具ImageMagick可以做到这一点。你可以将整个PDF文档转换为单个图像，或者也可以选择将页面输出为一系列枚举图像文件。...ImageMagick 非常智能，它会根据输出文件扩展名自动匹配输出格式。...-append，PDF转换为单个图像或一系列图像时，效果会有所不同。...如果页数较多，那么使用多个数字的枚举文件名会很方便，这样便于排序。你也可以用格式化的数字命名输出文件，如使用 %03d，得到的图片文件名数字部分都会是3位，不足的前置补零。

1.5K4 0

基于分割思想的文本检测算法

本文使用 Zhihu On VSCode 创作并发布在文本检测任务中，较少出现字符重合的情况（重合的字符人也认不出来啊），所以基于分割思想的文本检测算法也能得到很好的效果。 1....其计算步骤如下：计算梯度图；在梯度图中寻找梯度方向相反的边缘像素对；根据像素对得到连通域，然后使用人工规则对连通域进行筛选，得到字符区域；将字符区域拼接成文本行。...除这两种算法以外，还可以尝试使用一些通用的局部特征算子，我曾经用过harris角点，在文档和证件场景下的效果还是不错的。 2. 深度学习文本检测深度学习算法在误检方便表现比传统方法要好。...另外，虽然文本检测中比较少有重合字符，却还是需要处理字符粘连的情况，所以各种深度学习的模型在得到连通域之后，都需要再进行一步特殊的后处理过程。实现字符实例之间的区分。...score map上每个对应的检测框的坐标，这里的坐标有两种表示方式：（1）点到四个边界的距离+检测框的倾斜角度（2）检测框的四个顶点坐标。

1.8K2 0

手把手教学：提取PDF各种表格文本数据（附代码）

来源：量化投资与机器学习（ID：Lhtz_Jqxx）本文首发于量化投资与机器学习还在为抓取各种PDF格式的财务、数据报表而烦恼吗？还在为自己手工操作导致的效率低下而烦恼吗？...还在担心没有趁手的兵器吗？今天，公众号为大家介绍一款神器： PDFPlumbe 轻松玩转PDF，痛快抓数据！助你一臂之力！...安装PDFPlumbe pip install pdfplumber 要使用pdfplumber的可视化调试工具，还需要在计算机上安装ImageMagick（https://imagemagick.org...，但是没有捕获每组5个states/territories之间的水平边界。...通过这样做，我们可以看到报表主体的的每一行都有相同的宽度，并且每个字段都填充了空格(“”)字符。这意味着我们可以像解析标准的固定宽度数据文件一样解析这些行。

3.4K5 0

CVE-2022-44268 ImageMagick任意文件读取漏洞

前言▸ 我平时基本不单独发一些漏洞复现的文章，除非觉得很有学习意义。...ImageMagick这个属于特例，因为还是蛮有影响的，包括我司的许多产品实际上都是使用ImageMagick作为底层能力，之前有出现过因为Ghostscript的RCE 0day导致使用了ImageMagick...PoC▸ https://github.com/duc-nt/CVE-2022-44268-ImageMagick-Arbitrary-File-Read-PoC 复现▸ 我根据PoC做了一个复现的Docker...：https://www.metabaseq.com/imagemagick-zero-days/ metabaseq的文章可以说非常透彻了，只不过是英文的，于是这里我就主要翻(chao)译(xi)一些核心的流程...如果「关键字」是profile，那么ImageMagick就把「文本字符串」当做一个路径，并读取对应文件内容作为profile，文件内容以HEX形式嵌入新生成的PNG图片，攻击者下载新的图片就可以拿到读取的文件内容了

2.1K4 0

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

对于每个这些框，不管我们是否认为它包含一个目标，以及不管这个框里的坐标是什么，我们都会进行输出。下图展示了在单个滑动框位置上发生的操作： ?...，「这看起来像是婴儿的『上-中』部分吗？」，「这看起来像是婴儿的『上-右』部分吗？」等等。系统会对所有类重复这个过程。如果有足够的子区域表示「是的，我的确匹配婴儿的这个部分！」...然而，SSD 可以在单个步骤中完成上述两个步骤，并且在处理图像的同时预测边界框和类。...这些默认边的界框本质上等价于 Faster R-CNN 的 anchor box。对每个边界框都同时执行预测： a）边界框的偏移；b）分类的概率。...换句话说，如果有 4 个形状、尺寸等类似的边界框中有同一只狗，那么 NMS 就会保留信度最高的那个边界框而抛弃掉其它的。

1.5K7 0

【整理】上架4.3被拒，我做了这些，正在等结果

修改图片资源 1.修改hash值通过ImageMagick，可以实现对图片hash值的改变，同时不影响图片质量。...字符替换文件名的替换不在这多说，其实可以跟图片文件名更改采取类似的策略实现即可。文件内的内容：变量，类名，方法名或者一些字符串需要替换，那么可以通过全局搜索工具先搜索。...搜索之后，点击Find处，会弹出一个选项框，此时可以选择Replace。为了保证替换的精准度，在替换之前，可以对搜索出来的内容进行选中替换。...最后，在替换框填入替换的内容，视情况选择Replace或者Replace All。...朋友们可以参考下，是否是这样的原因。因为，我这两天还更新了其他好几个App，都是第二天就妥妥上架成功。祈祷这次上架成功上架成功吧

2K1 0

【文本检测与识别-白皮书-3.1】第二节：基于分割的场景文本检测方法

然后通过一些像素聚合的后处理方式将属于同一文本的文本像素点聚合在一起得到最后的文本实例边界框。...上述部分自顶向下的方法虽然也借鉴了分割的思路，但同时也结合了整个文本边界框的回归，而像素级别的基于分割的方法则完全依靠像素级别的分类和后处理得到文本检测的结果。...Hu 等人(2017)也是提出先检测单个字符区域，然后基于一些固定规则将这些字符拼接成任意方向的文本实例。常用的拼接规则有文本片段之间的水平和竖直方向距离以及尺度和方向的相似性等。...但该方法只能用于检测水平方向的文本，泛化性能比较差。...它通过类似的方式得到单字符的标注，然后通过高斯分布建模学习单个字符的中心概率以及字符之间的连接关系(character affinity)，再通过连接关系将各字符连接在一起获得文本行检测结果。

1K1 0

苹果审核2.1大礼包，这几个方面入手。

关于App Store的审核团队其实你有必要了解一下 ---- 这一点其实我觉得我们真的还是有必要了解一下的，比如说我听到的下面这些疑问： 1、App Store中国区的审核是在中国吗...有些翻译的会比较难理解，如果你中文在写一遍能帮助到审核人员正确理解你的意思！苹果 App Store 的所有审核团队都是在美国总部吗？还是每个区域市场单独审核？...下面是这个大礼包的截图，原邮件和谷歌翻译版同框！ ? 这就是传说中的2.1大礼包，针对上面的问题说说我们能做的处理有哪些！ ...2、图片资源修改名字，并且改变图片的hash值关于这一点，在下面的脚本中我们 .xcassets 文件里面的资源是直接能用脚本改的，其他的一下资源可能的我们手动改一下，当然你要改脚本也是完全可以的...方法：安装 ImageMagick，brew install imagemagick 压缩工程目录下所有 png 文件，find .

2.8K2 0

教程 | 单级式目标检测方法概述：YOLO与SSD

这么做的原因是用于图像分类的数据更易于标准（因此成本更低），因为其仅需单个标签，而不需要为每张图像都定义边界框标注。...（tx, ty, tw, th）因此，我们需要为上述属性中的每一个学习一个卷积过滤器，这样我们有 5+C 个输出通道来描述每个网格单元位置处的单个边界框。...尽管我们可以通过这些边界框的 pobj 分数滤除它们，但这会在预测得到的包含目标和不包含目标的边界框之间引入相当大的不平衡。 ?...类别标签最初的类别预测是在网格单元层面上执行的。这意味着单个网格单元不能预测不同类别的多个边界框。之后的修订版可以使用在类别和交叉熵损失上的 softmax 激活来预测每个边界框的类别。...尽管我们可以在得到一组固定的边界框预测后轻松滤除这些框，但仍然存在（前景—背景）类别不平衡的情况，这可能会给训练过程造成困难。

8271 0

用python解析pdf中的文本与表格【pdfplumber的安装与使用】

为了解决这个问题，我找到了几种解决方案，最后选择了python上的pdfplumber库，安装和使用都相对比较方便，效果也还不错，所以下面介绍这个库的安装与使用。...安装我的电脑配置环境： Win10+python3.6 和许多库一样，其基本安装只需要pip就可以了。...要使用这个功能，还需要安装ImageMagick （特别注意，是6.X版本而不是最新的7.X版本。...下载地址如下：https://legacy.imagemagick.org/script/binary-releases.php#windows ）按照官网的指示，理论上安装了这个就可以了，不过，我在使用...file.pdf") as pdf: first_page = pdf.pages[0] # 获取文本，直接得到字符串，包括了换行符【与PDF上的换行位置一致，而不是实际的“段落”】

4.8K1 0

记我在HackerOne上参与的一次漏洞众测邀请项目

从一个RCE漏洞到另一个RCE漏洞当我远程连接到测试目标站点之后，发现其服务中包含了 ImageMagick图片处理功能，所以，我理所应当地检查了其ImageMagick的版本： ?...可能大家都知道，ImageMagick在6.9.3-9之前的版本都存在包含RCE在内的多种漏洞，当然，幸运的是，该站点服务器也不可避免地沦陷了： ?...[REDACTED]=[REDACTED]&template=[REDACTED].tpl 前端开发者们都明白，.tpl是用于HTML代码中的模块Template文件，它的文件名能作为参数使用吗？...[REDACTED]=[REDACTED]&template=the_vulnerable_script.php 意想不到的是，我就这样得到了整个未解析执行的源码文件，所以，本质上来说，这就是一个本地文件泄露漏洞...在该请求中，如果把我的email地址换成他人用户的email地址，就能用请求包中设置包含的密码，替换更改他人的账户密码，整个过程不需要任何验证机制。

2.1K4 0

制作简单的公众号二维码关注图

于是，我就打算用这个库来实现简单的制作一个二维码关注图，主要是完成以下几个工作：制作一个白色的背景图；将背景图和公众号二维码图合成；添加文字得到最终的合成图简介 Wand 是基于 ctypes...库的适用于 Python 的 ImageMagick 的封装库。...实战安装完成后，这里首先需要准备一张或者几张要合成的图片，比如作为背景的图片和前景图片，这里我是先给定大小来生成背景图片，而前景图片自然是我的公众号二维码图片了： ?...这一步得到的结果如下所示，这里我设置的背景图片大小为： image_name = 'qrcode.jpg' qrcode_img, width, height = read_image(images_name...，其实也是 Python 很常见的问题，就是如果使用到中文的字符串的问题，本来我认为也是编码问题，但是我发现设置一个只包含英文字符串，和包含有中文字符串的结果是这样的： ?

1K2 0

怎么上架（含隐藏开关）的马甲包

关于App Store的审核团队其实你有必要了解一下这一点其实我觉得我们真的还是有必要了解一下的，比如说我听到的下面这些疑问： 1、App Store中国区的审核是在中国吗？...下面是这个大礼包的截图，原邮件和谷歌翻译版同框！这就是传说中的2.1大礼包，针对上面的问题说说我们能做的处理有哪些！...以及脚本的一些使用说明我也会在下面再细说的。 ...2、图片资源修改名字，并且改变图片的hash值关于这一点，在下面的脚本中我们 .xcassets 文件里面的资源是直接能用脚本改的，其他的一下资源可能的我们手动改一下，当然你要改脚本也是完全可以的...(NSString *)str {}>- (void)foo:(NSString *)str appLog:(NSString *)appLog {} -ignoreDirNames [忽略文件夹名称字符串

2.4K10 0

服务器端的图像处理 | 请召唤ImageMagick助你解忧

/download.php 因为我是 MAC 机器，演示一下 brew 的安装方式咯： >>>> 基本命令与格式 >>>> 1、基本命令 ImageMagick 包括一组命令行工具来操作图片...：上面的例子中，输入的图片和输出的图片比例是一致的，所以不会有特殊情况出现，但是遇到比例不同的时候，上面的写法并不会得到 150x100 的图像，而是会根据图像的宽高比例，取最大值，得出来的结果可能是...>>>> 3、绘制验证码大概逻辑如下：随机生成 4 个英文字母或数字创建一个宽高 100x40 的画布设置字体大小为 16，每个字符的宽高也就是 16 左右了，依次计算出每个字符的 x, y...joy，但是 -swap 0,1 的意思是交换第一张图与第二张图的位置，所以 joy 变成跑到后面了 +append：水平连接当前图像列表的图像来创建单个较长的图像 -append：垂直连接当前图像列表的图像来创建单个较长的图像...的写法： 5.4、获取页数通过 identify 命令我们可以简要得到文件的信息，如下： ?

3.3K1 0

数据科学家目标检测实例分割指南

y = 边界框左上角 y 坐标 w = 边界框的宽度（以像素为单位） h = 边界框的高度（以像素为单位）模型因此，在此设置中，我们创建一个多输出模型，该模型以图像为输入，具有（n_labels...有一件事我想在这里提醒一下，我们正在尝试执行目标定位任务，但这里仍有我们的卷积神经网络。我们只是增加了一个输出层，也预测边界框的坐标和调整我们的损失函数。...我们得到图像，利用RPN策略得到的建议区域和地面目标真正标签框（标签，地面标签框）接下来，我们将所有区域建议与地面真实标签框IoU（交并比）大于等于 0.5 的，作为该检测框训练的正样本，其余建议为负样本...测试时间 R-CNN 在测试时，我们使用特定于类的 SVM 预测检测框。在测试时，我们将得到很多重叠的检测框。因此，非最大抑制是目标检测算法中的重要组成部分。...左：锚点，居中：单个点的锚点，右侧：所有锚点 1.我们从一些预定义区域开始，我们认为我们的目标可能再在锚点上。 2.我们的区域建议网络（RPN）对哪些区域具有目标和目标边界框的偏移量进行分类。

1.1K4 1

场景文本检测—CTPN算法介绍

先来看一个简单的OCR的流程：第一步，通过图像信息采集（一般就是相机），得到包含了待识别字符的图像，分析结构。第二步，运用阈值操作等一些图像处理的方法对待测对象进行去噪和矫正。...第三步，因为文本信息的特殊性质，需要进行行列分割，对单个字符，或者是连续几个字符进行检测。第四步，将分割后的字符图像导入识别模型中进行处理，进而得到原图中的字符信息。...coordinates:表示选择框的高度和中心的y轴的坐标；2k scores:表示的是k个anchor的类别信息，说明其是否为字符；k side-refinement表示的是选择框的水平偏移量。...本文实验中anchor的水平宽度都是16个像素不变，也就是说我们微分的最小选择框的单位是 “16像素”。 5.用文本构造的算法，将我们得到的细长的矩形（如下图7），然后将其合并成文本的序列框。...xside 表示回归出来的左边界或者右边界，cxa 表示anchor中心的横坐标，w a是固定的宽度16像素。

19.6K6 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

正则表达式笔记

卷积神经网络在图像分割中的进化史：从R-CNN到Mask R-CNN

RepPoints：可形变卷积的进阶

用FreeSWITCH进行图像处理

pdf到png再到mp4短视频：不需要工具，2个指令1键搞定

基于分割思想的文本检测算法

手把手教学：提取PDF各种表格文本数据（附代码）

CVE-2022-44268 ImageMagick任意文件读取漏洞

深度学习目标检测模型全面综述：Faster R-CNN、R-FCN和SSD

【整理】上架4.3被拒，我做了这些，正在等结果

【文本检测与识别-白皮书-3.1】第二节：基于分割的场景文本检测方法

苹果审核2.1大礼包，这几个方面入手。

教程 | 单级式目标检测方法概述：YOLO与SSD

用python解析pdf中的文本与表格【pdfplumber的安装与使用】

记我在HackerOne上参与的一次漏洞众测邀请项目

制作简单的公众号二维码关注图

怎么上架（含隐藏开关）的马甲包

服务器端的图像处理 | 请召唤ImageMagick助你解忧

数据科学家目标检测实例分割指南

场景文本检测—CTPN算法介绍

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐