菊花绽放:微信是如何识别小程序码的?

作者:lincolnlin,endyxu,changoran

【小程序码-设计篇】菊花绽放 一文中介绍了小程序码的设计过程,本文继续分享我们在小程序码识别上面的一些心得,权当抛砖引玉,欢迎有共同兴趣的同事一起讨论。

识别之前,我们需要对照片做什么处理

打开扫一扫,扫码引擎通常采集到的图片是这样子的。

引擎其实并不关心这朵菊花是什么颜色,因此,我们把图片简化,处理成灰度图。

二值化可以让引擎做的事情更简单,因此再将灰度图处理成位图。

如何在黑白图中快速找到菊花的位置

细心的朋友肯定注意到,每一朵菊花都有两个共同点:

  • 3 个圆形的“牛眼”(定位点)
  • 右下角的“小程序 LOGO”

以上是小程序码的定位信息,准确的定位是识别的第一步。

如何快速找出所有可能的定位点

在设计这个菊花码时,我们是按照 0.8 : 1.2 : 1 : 1.2 : 0.8 绘制定位点的。

为什么不采用 1:1:1:1:1 的比例?因为前者比例比较贴近黄金比例,更符合人类审美需求。(下图右为 1:1:1:1:1)

基于这个特性,使用水平,垂直,45 度角等三个方向的扫描线扫描全图。如果三个方向的黑白像素都接近这个比例,显然它极可能是一个定位点。

怎么定位“小程序 LOGO”

最简单的方法,根据 3 个定位点的位置,预估小程序 LOGO 的中心位置(平行四边形)

在很多扭曲的情况下,上述方法仍有较大偏差。因此我们提出了一种改进方法:基于 LOGO 为圆形的特性,将预估的中心点修正到圆心位置

具体校正方法如下:

拍摄出来的码这么“歪”,能否进行“摆正”

由于上文中,我们已经找到了码在图像中的位置,但由于这个码可能已经被旋转,扭曲,所以,我们需要再做一次矩阵变换(透视变换),将其变换到直角坐标系。变换后的码,已经比较易于被机器解读了。

怎么读码

二维码怎么读码

上述流程和传统二维码识别的核心思想并无二致,如果你坚持看到这里,说明你已经知道如何识别二维码了。

经过透视变换,二维码其实已经变成了单位矩阵(如上图,你可以理解一个小块为一个像素点,这里为了方便阅读,放大了),那么,我们顺着二维码的编码路径,就能完整地读出编码信息了。

小程序码怎么读码

其实,按照二维码的套路,我们可以把透视变换后的图,进行编码区域划分。值得注意的是,这里一个彩色小块并非一个像素点,而是一片区域。一个编码块是 0 还是 1,取决于该区域上的黑色像素(面积)的比例,我们称之为“投票法”。

是否有其他读码方案

但在实际应用中,我们发现该方法对于扭曲的场景,识别效率很低,鲁棒性不佳。经过各种尝试和思考,我们借鉴了一维码的识别思路 ——“采样法”。

举个例子,上图中,我们用红色扫描线采样一维码的信息,对于采样的一行像素,我们根据比例读出具体的编码。

类比该方案,我们利用小程序码为“放射线”编码的特性,采样每一条放射线上的一个像素序列,根据黑白比例读出每一条线的编码信息。

目前扫码引擎的性能如何,能应对什么场景

在测试阶段,我们内部自行拍摄采集了各种场景下的大量测试样本,做了如下评测

包括如下场景

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

许典平的专栏

1 篇文章2 人订阅

我来说两句

1 条评论
登录 后参与评论

相关文章

来自专栏鹅厂优文

游戏人工智能 读书笔记 (六) AI算法简介——演化算法

Chapter 2.8 Hybrid Algorithm: Neuroevolution

2209
来自专栏思影科技

EEG和fNIRS同步研究揭示年龄和神经反馈对运动想象信号的影响

注释:这篇文章相当长,请耐心看完。 来自德国奥尔登堡大学心理学部的Catharina Zich等人在Neurobiology of Aging杂志上发表了一项基...

3366
来自专栏AI传送门

吊炸天的CNNs,这是我见过最详尽的图解!(上)

2405
来自专栏自然语言处理

十分钟学习自然语言处理概述

文本挖掘是信息挖掘的一个研究分支,用于基于文本信息的知识发现。文本挖掘的准备工作由文本收集、文本分析和特征修剪三个步骤组成。目前研究和应用最多的几种文本挖掘技术...

562
来自专栏AI科技大本营的专栏

AI 技术讲座精选:数学不好,也可以学习人工智能(四)——图解张量

【AI100 导读】本文是《数学不好,也可以学习人工智能》系列的第四篇文章,主要内容围绕 Tensors(张量)展开。 ? 现在的你是否已经下载好 Tensor...

4266
来自专栏量子位

OpenAI发布可扩展的元学习算法Reptile | 论文+代码+Demo

昨天,OpenAI发布了一种新型的可扩展元学习算法Reptile,还能在线试玩。 何为Reptile?难道是—— ? 咳咳严肃一点。 据OpenAI官方博客显示...

3295
来自专栏小鹏的专栏

机器学习中的Bias(偏差),Error(误差),和Variance(方差)有什么区别和联系?

首先 Error = Bias + Variance + Noise Error反映的是整个模型的准确度,Bias反映的是模型在样本上的输出与真实值之间的误差...

2318
来自专栏大数据文摘

手把手 | Python代码和贝叶斯理论告诉你,谁是最好的棒球选手

1164
来自专栏AI科技评论

开发 | TOP5%Kaggler:如何在 Kaggle 首战中进入前 10%

Introduction Kaggle 是目前最大的 Data Scientist 聚集地。很多公司会拿出自家的数据并提供奖金,在 Kaggle 上组织数据竞赛...

4938
来自专栏黄成甲

数据分析之回归分析

回归,最初是遗传学中的一个名词,是由生物学家兼统计学家高尔顿首先提出来的。他在研究人类的身高时,发现高个子回归于人口的平均身高,而矮个子则从另一个方向回归于人口...

1185

扫码关注云+社区