zxing源码分析——QR码部分

Advertisement


以下内容转载自:http://kuangjianwei.blog.163.com/blog/static/190088953201361015055110/

写的太好了,把源码分析的相当到位,图像识别感兴趣的朋友可以看下。

Java代码结构:

zxing源码的结构还是比较清晰的,有关QR码的代码主要在以下几个package中。Java代码中有生成QR码的代码,在C++代码中是没有生成部分,只有解析部分。

其中qrcode中是编解码的接口,外部代码通过这两个类来进行QR码的编解码。

detector是用来在摄像头抓取的图像中检测出QR码的那部分,并将其提取出来。这部分代码是解码的关键,也是可以进行优化的部分。

decoder是按照QR码的编码规范将之前detector中提取出的QR码符号进行解码操作,将图像解析为真实的信息。

QR码解码流程:

1、将图像进行二值化处理,1、0代表黑、白。

2、寻找定位符、校正符,然后将原图像中符号码部分取出。(detector代码实现的功能)

3、对符号码矩阵按照编码规范进行解码,得到实际信息(decoder代码实现的功能)

二值化:

zxing中条码的二值化都是使用Binarizer实现,一维码使用getBlackRow方法,二维码的使用getBlackMatrix方法。Binarizer有两个生成类,GlobalHistogramBinarizer和HybridBinarizer;这两个类对getBlackMatrix方法的实现有不同,HybridBinarizer中的实现对于某些条件下的图像有些特殊的处理,暂时没有看懂,这里只介绍GlobalHistogramBinarizer中二值化的方法。

二值化的关键就是定义出黑白的界限,我们的图像已经转化为了灰度图像,每个点都是由一个灰度值来表示,就需要定义出一个灰度值,大于这个值就为白(0),低于这个值就为黑(1)。在GlobalHistogramBinarizer中,是从图像中均匀取5行(覆盖整个图像高度),每行取中间五分之四作为样本;以灰度值为X轴,每个灰度值的像素个数为Y轴建立一个直方图,从直方图中取点数最多的一个灰度值,然后再去给其他的灰度值进行分数计算,按照点数乘以与最多点数灰度值的距离的平方来进行打分,选分数最高的一个灰度值。接下来在这两个灰度值中间选取一个区分界限,取的原则是尽量靠近中间并且要点数越少越好。界限有了以后就容易了,与整幅图像的每个点进行比较,如果灰度值比界限小的就是黑,在新的矩阵中将该点置1,其余的就是白,为0。

提取符号码:

这部分是解码的关键部分,解码能力的高低也主要体现在这里(不过我感觉二维码本身设计的就比较好,对图像扭曲变形的纠错能力比较高,所以代码部分对这方面的处理就比较少)。这部分的目标是从像素为单位的原始图像中提取出符号码部分,并转换为模块为单位的符号码矩阵。

将二值化之后的矩阵交给Detector,其detect方法就是接口方法。调用这个方法就会返回取好的符号码矩阵。下面详细介绍detect方法所做的工作:

1、寻找定位符

寻找定位符是FinderPatternFinder这个类来实现的。

在图像中每隔iSkip就采样一行,

int iSkip = (3 * maxI) / (4 * MAX_MODULES);

在这一行中将连续的相同颜色的像素个数计入数组中,数组长度为5位,即去找黑\白\黑\白\黑的图像(如开始检测到黑色计入数组[0],直到检测到白色之前都将数组[0]的值+1;检测到白色了就开始在数组[1]中计数,以此类推)。填满5位后检测这5位中像素个数是否比例为1:1:3:1:1(可以有50%的误差范围),如果满足条件就说明找到了定位符的大概位置,将这个图像交给handlePossibleCenter方法去找到定位符的中心点,方法是先从垂直方向检测是否满足定位符的条件,如满足就定出Y轴的中心点坐标值,然后用这个坐标值去再次检测水平方向是否满足定位符条件,如满足就定出X轴的中心点坐标值。至此就找到了一个定位符的中心坐标。

按照上面所说的步骤找出所有三个定位符的中心坐标,接下来开始定位三个定位符在符号中的位置,即左上(B点)、左下(A点)、右上(C点)三个位置。先通过两两之间的距离定出哪个是左上那一点(左上那点到其他两点的距离应该相差不远),然后通过计算BA、BC向量的叉乘定出A和C两点。

2、寻找校正符

通过ABC三点的坐标计算出校正符的可能位置,然后交给AlignmentPatternFinder去寻找最靠近右下角的那个校正符,寻找方法与寻找定位符的方法基本相同,如果找到就返回校正符的中心坐标,如果没有找到也没关系,解码程序可以继续。

3、透视转换,生成最终矩阵

找到了三个定位点和一个校正符的坐标(校正符没有找到可以用一个计算值来代替),符号图像的位置就已经确定了,现在要进行图像变形,建立起以模块为单位的符号矩阵与原图像之间的关系,使用的方法是George Wolberg写的Digital Image Warping一书中PerspectiveTransform方法(书中54-56页)。转换关系确立了就将新矩阵(以模块为单位的符号矩阵)中每一个点对应到原图像中的点,去看该点是黑是白,并将0、1置填充到矩阵中。这样就生成了最终的符号码。

至此,解码过程结束

另外,zxing也有c++和oc版本的,方法和类结构都是一样的,相当于重新翻译了一遍。

Similar Posts:

  • 购物小票上加打二维码(QR码)信息技术

    随着移动互联技术的发展,以及B2B,O2O商业模式的突飞猛进,二维码技术的应用有了很好表现.二维码扫一扫,你的钱全跑了. 本文将介绍如何在电脑购物小票上加打二维码技术.首先,谈谈为什么在电脑购物小票加打QR码?QR码其实就是一组经过编码的信息,如果打印到电脑购物小票,对顾客来说,他们希望是这个QR码是抽奖.免费停车.现金礼券礼品,,,,,.等.对商家来说,唯一的要求可能就是吸引消费者的信息,如促销信息.打折信息等,对购物中心场地管理方来说,他们是关心他们的地盘旺不旺,能不能收不到租金,能不能收到

  • 二维码zxing源码分析(四)wifi部分

    前三个部分的地址是:ZXING源码分析(一)CAMERA部分 . zxing源码分析(二)decode部分.zxing源码分析(三)result.history部分 前面三篇文章基本上已经把zxing的核心源码看的差不多了,现在我们在分析它所包含的功能的部分,其实history也是属于这一部分的,但是放在第三篇说了 核心类: com.google.zxing.client.android.wifi.WifiConfigManager wifi管理类,通过它用解析后的结果进行管理 com.goog

  • Solr4.8.0源码分析(5)之查询流程分析总述

    Solr4.8.0源码分析(5)之查询流程分析总述 前面已经写到,solr查询是通过http发送命令,solr servlet接受并进行处理.所以solr的查询流程从SolrDispatchsFilter的dofilter开始.dofilter包含了对http的各个请求的操作.Solr的查询方式有很多,比如q,fq等,本章只关注select和q.页面下发的查询请求如下:http://localhost:8080/solr/test/select?q=code%3A%E8%BE%BD*+AND+l

  • mongodb源码分析(二十五)mongos writeback

    这里的writeback也许可以翻译成回写,是指发生如下情况,来自mongos对mongod的数据请求,但是请求时发现版本不对了(发生了chunk的迁移)那么这里的请求将得不到响应,这里的请求需要以某种方式回到mongos,然后再次发往正确的mongod,这就是所谓的writeback.下面直接来看代码.先来看一份简化了的插入操作代码. void receivedInsert(Message& m, CurOp& op) { if ( handlePossibleShardedMessag

  • ABP源码分析三十五:ABP中动态WebAPI原理解析

    动态WebAPI应该算是ABP中最Magic的功能之一了吧.开发人员无须定义继承自ApiController的类,只须重用Application Service中的类就可以对外提供WebAPI的功能,这应该算是对DRY的最佳诠释了. 如下图所示,一行代码就为所有实现了IApplicationService的类型,自动创建对应的动态WebAPI. 这么Magic的功能是如何实现的呢? 本文为你揭开其Magic的外表.你会发现,实现如此Magic的功能,最关键的代码只有四行. 先思考一个问题:如果不

  • 【集合框架】JDK1.8源码分析之HashMap & LinkedHashMap迭代器(三)

    一.前言 在遍历HashMap与LinkedHashMap时,我们通常都会使用到迭代器,而HashMap的迭代器与LinkedHashMap迭代器是如何工作的呢?下面我们来一起分析分析. 二.迭代器继承图 三.HashMap迭代器 3.1 HashIterator HashIterator是一个抽象类,封装了迭代器内部工作的一些操作. HashIterator类属性 abstract class HashIterator { // 下一个结点 Node<K,V> next; // next e

  • ABP源码分析二:ABP中配置的注册和初始化

    一般来说,ASP.NET Web应用程序的第一个执行的方法是Global.asax下定义的Start方法.执行这个方法前HttpApplication 实例必须存在,也就是说其构造函数的执行必然是完成了. ABP开始的地方就是HttpApplication的构造函数. 如下图一,Abp定义了一个继承自HttpApplication的类AbpApplication.该类的构造函数里会创建AbpBootstrapper实例,然后再Application_Start方法中调用AbpBootstrapp

  • ABP源码分析十七:DTO 自动校验的实现

    对传给Application service对象中的方法的DTO参数,ABP都会在方法真正执行前自动完成validation(根据标注到DTO对象中的validate规则). ABP是如何做到的? 思路无外乎通过Castle的拦截器实现AOP.本文主要分析ABP是如何设计. Ivalidate: 空接口,用于标识该接口的对象在使用前需要被validate先. IInputDto:用于输入参数的DTO,该接口继承自Ivalidate.所以所有作为输入参数的DTO都会在使用前先validate. I

  • ABP源码分析三十四:ABP.Web.Mvc

    ABP.Web.Mvc模块主要完成两个任务: 第一,通过自定义的AbpController抽象基类封装ABP核心模块中的功能,以便利的方式提供给我们创建controller使用. 第二,一些常见的基础功能的实现. AbpController:这是一个抽象基类,继承自MVC Controller,是ABP系统中所有controller的基类.如下图中,其封装了ABP核心模块中提供的大多数的功能.同时实现了一些公共的方法.它有三个派生类:AbpAppViewController,AbpScripts

  • ABP源码分析三十九:ABP.Hangfire

    ABP对HangFire的集成主要是通过实现IBackgroundJobManager接口的HangfireBackgroundJobManager类完成的. HangfireBackgroundJobManager:实现了接口IBackgroundJobManager中的方法EnqueueAsync,通过HangfireBackgroundJob完成Enqueue.重写了BackgroundWorkerBase中的Start和WaitToStop方法. AbpHangfireConfigura

Tags: