车牌号识别系统-某大学MSE学位论文开题报告.doc

资源描述

《车牌号识别系统-某大学MSE学位论文开题报告.doc》由会员分享，可在线阅读，更多相关《车牌号识别系统-某大学MSE学位论文开题报告.doc（28页珍藏版）》请在三一文库上搜索。

1、工业大学软件学院软件工程硕士学位论文开题报告研究生学号入学时间 2008年实习单位公司校内导师实习单位导师论文题目车牌号识别系统的设计与实现开题报告日期 2010年工业大学软件工程硕士学位论文开题报告目录目录11 论文选题的目的和意义21.1课题来源，项目名称21.1.1 课题来源21.1.2项目名称21.2与本课题有关的国内外研究状况31.2.1 智能交通系统和车号识别系统现状概述31.2.2车牌识别系统研究现状31.3本课题研究的主要内容42 研究方案52.1技术方案52.1.1 系统需求分析52.1.2系统的总体设计62.1.3系统的

2、各个模块的具体设计92.1.9技术措施172.2方案实施所需的条件172.2.1技术条件172.2.2试验条件172.3存在的主要问题和技术关键182.3.1 存在的主要问题182.3.2 技术关键182.4预期达到的目标232.4.1 性能目标232.4.2解决方案：232.4.3功能目标：243 研究计划进度表和经费预算及经费落实253.1 研究计划进度表253.2 经费预算及经费落25主要参考文献26校内外导师意见271 论文选题的目的和意义1.1课题来源，项目名称1.1.1 课题来源随着经济的发展和道路交通事业的发展，以计算机图像处理技术，通信技术和信息管理技术为核心的智能化道路交通监

3、控和管理系统在道路交通安全管理领域和小区的智能化管理得到了广泛的运用。车辆牌照的自动识别是计算机视觉与模式识别技术在智能交通领域应用的重要研究课题之一，是实现交通管理智能化的重要环节【1】。智能交通系统ITS【2】是近些年来在世界上兴起的一个跨学科、系统化的综合研究体系。近十几年来，世界各国交通拥堵、交通事故和环境污染越来越影响着社会经济发展和生活。虽然道路运输增长的需求可以靠提供更多的道路设施来满足，但是在资源、环境矛盾越来越突出的今天，道路设施的增长将受到限制，这就需要依靠提供除设施之外的技术方法来满足这一需求。智能运输系统就是解决这一矛盾的途径之一，其重要性正被越来越多的人所认可【3】。

4、目前，世界上对智能交通系统尚没有统一的定义，其大体的含义是将先进的计算机处理技术、信息技术、数据通讯传输技术及电子自动控制技术等有效地综合运用于整个交通管理体系，将人、路、车有机结合起来，以达到最佳的和谐统一，从而建立起的一种在大范围内、全方位发挥作用的实时、准确、高效的交通运输综合管理系统【4】。ITS是为解决机动化导致的交通问题及其经济、社会、生态系统外部效益直接下降而产生的，因而智能交通系统的目标应体现社会、经济、生态系统三个层次的效益提高。本课题是基于智能交通系统下的车号识别系统，即对车牌号进行识别分析的工作。1.1.2项目名称车号识别系统的设计与实现1.2与本课题有关的国内外研究状况

5、1.2.1 智能交通系统和车号识别系统现状概述汽车牌照识别技术(License Plate Recognition，LPR【5】，简称“车牌通”)是一个特定目标为对象的专用计算机视觉系统，该系统能从一幅图像中自动提取车牌图像，自动分割字符，进而对字符进行识别，它运用模式识别，人工智能技术，对采集到的汽车图像进行处理，能够实时准确地自动识别出车牌的数字、字母及汉字字符，并以计算机可直接运行的数据形式给出识别结果，使得车辆的电脑化监控和管理成为现实车牌定位、字符切分，并运用独创的基于二值特征的识别算法和基于灰度特征的识别算法相结合【6】，是ITS的一个重要组成部分，它的成功开发必将大大加速ITS的

6、进程。汽车牌照识别技术具有广泛的应用前景。运用图像处理技术解决汽车牌照识别的研究最早出现于80年代，这个阶段的研究并没有形成完整的系统体系，而是就车牌识别中的某一个具体问题进行讨论，并且通常是采用简单的图像处理技术来解决。识别过程是使用工业电视摄像机(Industrial TV Camera)【7】拍下汽车的正前方图像，然后交给计算机进行简单处理，并且最终仍需要人工干预。特别是在汉字识别方面，没有找到很好的处理方法【8】。1.2.2车牌识别系统研究现状目前，发达国家依靠其先进的硬件和软件的生产能力，使得LPR系统在实际交通系统中已成功应用广泛应用于以下场合：1) 泊车(Parking)：用于预

7、付费车主进入停车场的自动放行和泊车费用的计算。2) 通行控制(Access Contr01)：在有安全需要的场合，对拥有授权的汽车自动放行。3) 费用收缴(Tolling)：在收费公路上，计算并收缴行车费用。4) 边境交通控制(Border Contr01)：纪录并控制过境车辆，进行放行控制和纪录。5) 被盗汽车的追查(Stolen cars)：识别被盗车辆的牌照，进行跟踪和报警。6) 超速罚款(Enforcement)：识别违反交通规则的车辆牌照，并记录在案。7) 交通管制(TramcContr01)：指挥汽车行驶路线，避免交通堵塞，提高交通效率。8) 汽车销售工具(Marking T001

8、)：按照不同的市场需求，通过牌照的识别建立相应的数据库可为汽车的销售提供丰富的信息资源。9) 城市交通监控(Travel)：根据牌照的识别结果，可以监控汽车的行驶速度，路线等信息。由于汽车牌照识别的广泛应用，发达国家的智能交通系统fITS)得到高度发展，对加强高速公路、城市道路管理，减少交通事故、车辆被盗案件的发生，保障社会稳定等方面产生重大而深远的影响。在当前的联网收费新形势下，我国已有几个省市规定车牌识别系统为高速公路机电工程必须配套建设的项目。国内已经建立起车牌自动识别技术的实验研究项目，如交通部ITS中心、长安大学等。目前已建成高速公路上车牌自动识别系统主要有：汕汾高速(广东第一条上车

9、牌识别系统的高速公路2001年2月)、普惠高速；九景高速(江西第一条上牌照识别的高速公路2002年6月)、昌樟高速、昌泰高速等：在西部地区主要有：昆玉高速(国内首条通过招标上牌照识别系统2002年8月)、楚大、大宝等。交通自动化程度的普及提高已经成为发展交通事业的一个必不可少的课题。1.3本课题研究的主要内容本课题主要研究了智能交通中的车号识别系统中的软件部分，即用c语言来完成一个从数字信号处理器【14】（DSPS）中提取的车牌图像的识别和分类工作。其中运用大量数字图像处理技术，以及模式识别技术。本报告具体的内容和章节安排如下：1. 论文选题的目的和意义，包括课题的来源、项目名称，与本课题有关

10、的国内外研究现状，本课题研究的主要内容。2. 主要对在本论文中出现的一些图像处理基本理论作简要介绍，其中包括图像的点运算，几何变换、图像增强、边缘检测和图像分割。包括项目实施的技术方案、方案实施所需的条件、系统实现存在的主要问题和技术关键、系统预期达到的目标。3. 主要介绍研究计划进度表和经费预算及经费落实情况。-27-2 研究方案2.1技术方案2.1.1 系统需求分析2.1.1.1 应用场合1) 泊车(Parking)：用于预付费车主进入停车场的自动放行和泊车费用的计算。2) 通行控制(Access Contr01)：在有安全需要的场合，对拥有授权的汽车自动放行。3) 费用收缴(Tollin

11、g)：在收费公路上，计算并收缴行车费用。4) 边境交通控制(Border Contr01)：纪录并控制过境车辆，进行放行控制和纪录。5) 被盗汽车的追查(Stolen cars)：识别被盗车辆的牌照，进行跟踪和报警。6) 超速罚款(Enforcement)：识别违反交通规则的车辆牌照，并记录在案。7) 交通管制(TramcContr01)：指挥汽车行驶路线，避免交通堵塞，提高交通效率。8) 汽车销售工具(Marking T001)：按照不同的市场需求，通过牌照的识别建立相应的数据库可为汽车的销售提供丰富的信息资源。9) 城市交通监控(Travel)：根据牌照的识别结果，可以监控汽车的行驶速度，

12、路线等信息。2.1.1.2功能需求经过分析，车号识别系统主要需要完成如下功能，满足用户如下需求：1) 图像采集功能：对需要识别车牌的车辆的图像的采集与存取。该功能不是本课题研究的主要内容。2) 对原始图像的预处理功能：由于准确识别和压缩数据量的需要，要对获取的原始图像要经过一系列如：灰度化、平滑、去燥等预处理才能将处理后的数据进行分析处理。这一部分功能包括很多子功能如：灰度化、平滑、滤波等。3) 车牌定位与提取功能：车牌号识别系统的最终目的是识别车牌号，所以对于系统最有用的图像就是车牌。因此，在预处理后的图像，只需要将车牌部分提取出来，这样大大减少了数据量。4) 车牌图像的预处理功能：提取后的

13、车牌图像还存在一些噪声信息如车牌的边框，并且原始图像中的车牌可能是倾斜的，需要矫正。此功能同样包括二值化、细化、边框去除和倾斜矫正等子功能。5) 字符提取功能：本系统最终目标是识别车牌上的字符，所以需要将预处理后的字符进行提取。此功能包括字符提取和字符归一化子功能。6) 字符识别功能：此功能是本系统的最重要的功能，就是将提取后的字符进行识别并输出。7) 数据存取功能：对需要处理的图像和字符数据进行存储和提取。此功能不是本课题的主要研究方向。2.1.2系统的总体设计2.1.2.1 系统的总体结构示意首先，数字摄像机采集车辆的原始图像并存入数据库，系统对采集的图像经过一系列的处理，最后输出识别结果

14、并存入数据库。其总体系统结构示意图如图2-1：图2-1 车号识别系统结构示意图2.1.2.2 系统的业务流程系统的业务流程从获取的原始图像开始，经过预处理、车牌定位、车牌的预处理、字符提取、字符识别，最终输出识别后的字符。系统的业务流程图如图2-2：图2-2 系统的业务流程图2.1.2.3 系统的总体架构根据系统的总体设计，系统按照层次结构分为四层。操作系统/网络层：这是本系统的最底层界面，由操作系统和网络组成。数据库层：系统的数据存储在数据库中，系统存取数据通过数据库进行操作。业务逻辑层：包括图像获取、图像预处理、车牌提取、车牌图像的预处理、字符提取、字符识别等主要业务功能。用户界面层：提供

15、给用户一个可以使用的可视化窗口。可视化窗口包括获取图像窗口、提取车牌窗口、识别并输出字符窗口。图2-3 系统的总体架构图2.1.2.4 系统的功能模块设计根据系统的需求分析，得出本系统应该满足以下功能模块：1) 图像采集功能模块：此模块的功能是对需要识别车牌的车辆的图像的采集与存取。该功能不是本课题研究的主要内容。2) 预处理功能模块：此模块的功能是对获取的原始图像要经过一系列如：灰度化、平滑、去燥等预处理才能将处理后的数据进行分析处理。这一部分功能模块包括很多子模块：图像灰度化子模块、图像增强子模块、图像平滑子模块、图像分割子模块。3) 车牌提取功能模块：此模块的功能是将处理后图像的车牌部分

16、提取出来，这样大大减少了数据量。4) 车牌（图像）预处理功能模块：此模块的功能是对提取后的车牌图像进行预处理。此功能模块包括二值化子模块、细化子模块、边框去除子模块、倾斜校正子模块。5) 字符提取功能模块：此模块的功能是对预处理后的车牌图像中的字符进行提取。此功能模块包括字符提取子模块和字符归一化子模块。6) 字符识别功能模块：此模块的功能是将提取后的字符进行编码后识别并输出。7) 数据存取功能模块：此模块的功能是对需要处理的图像和字符数据进行存储和提取。此功能不是本课题的主要研究方向。系统的功能模块图如下图所示：图2-4 系统的功能模块图2.1.3系统的各个模块的具体设计2.1.3.1 图像

17、采集功能模块此模块不是本课题研究范围，因此不做论述。2.1.3.2图像预处理功能模块由于图像采集系统采集到的图像是原始图像，其中有许多噪音、干扰、还有格式上的不统一，因此要对原始图像进行统一的处理。2.1.3.2.1图像灰度化子模块图像预处理的第一步就是要把彩色图像进行灰度化。任何颜色都是由R、G、B三种颜色按不同比例混合而成。对这样一幅彩色图像进行处理，需要非常大的运算量。因此直接对彩色图像进行处理达不到快速、实时的要求。因此预处理第一步就是把彩色图像转化为灰度图像。在实际处理时，我们利用R、G、B三种颜色的特点，见式（2-1），利用灰度值V和RGB颜色对应关系转换成灰度图。（2-1）式中

18、R、G、B分别为输入彩色图像的红、绿、蓝三色分量。在灰度图确定之后，由于存在光照等原因造成图像的模糊可以用灰度拉伸的方法进行图像处理。灰度拉伸的含义就是把感兴趣的灰度域范围拉开，使得该范围的像素，亮的越亮，暗的更暗，也有利于后续处理。一般灰度拉伸采用见式（2-2）：（2-2）其中的min和max可以根据经验来确定。2.1.3.2.2图像增强子模块灰度化后的图像需要进行图像增强处理，所谓的图像增强就是将那些对我们有用的图像信息进行增强。在这里我们通过将原图像的直方图变换为均匀分布的形式，这样就增加了象素灰度值得动态范围从而达到增强图像整体对比度的效果。图像的灰度统计直方图是1个1-D的离散函

19、数，见式（2-3）（2-3）上式中的sk为图像f(x,y)的第k级灰度值，nk是f(x,y)中具有灰度值sk的象素个数，n是图像象素总数。因为p(sk)给出了对sk出现概率的1个估计，所以直方图提供了原图的灰度分布情况，也可以说给出了1副图所有灰度值的整体描述。1) 列出原始图灰度级sk，k=0,1,7；2) 统计原始直方图各灰度级象素nk；3) 用式（2-3）计算原始直方图；4) 计算累积直方图；5) 取整扩展：tk=int(N-1)tk+0.5；6) 确定映射对应关系（sktk）；7) 统计新直方图各灰度级象素nk；8) 用pt(tk)= nk/n计算新直方图；2.1.3.2.3图像平滑

20、子模块图像增强之后的工作就应该考虑一下图像的平滑即和去除噪声，一般情况下可以用邻域平均法来去除噪声。在灰度连续变化的图像中，如果出现了与相邻像素的灰度相差很大的点，比如一片暗区中突然出现了一个亮点，人眼能很容易察觉到。这种情况被认为是一种噪声。灰度突变在频域中代表了一种高频分量，低通滤波器的作用时就滤掉高频分量，从而达到减少噪声的目的。为了方便叙述：“将原图中的每一个点的灰度和它周围八个点的灰度相加然后除以9，作为新图中对应点的灰度”这一操作。但是考虑到这种传统的计算方法不能够精确地除躁，因而采取了一种中值滤波的算法进行进一步出去噪声。本文考虑到传统的图像平滑技术存在的漏洞决定采用中值滤波的算

21、法，所谓中值滤波，就是指把以某点(x，y)为中心的小窗口内的所有像素的灰度按从大到小的顺序排列，将中间值作为(x，y)处的灰度值(若窗口中有偶数个像素，则取两个中间值的平均)。如图2-5：图2-5 中值滤波前后比较图图2-5中左边是原图，数字代表该处的灰度。可以看出中间的6和周围的灰度相差很大，是一个噪声点。经过中值滤波后就可以得到右边那幅图，可以看出，噪声点被去除了。2.1.3.2.4图像分割子模块图像的边缘是图像的最基本特征。所谓边缘是指其周围像素灰度有阶跃变化或屋顶变化的那些像素的集合，是图像中灰度发生急剧变化的区域。图像灰度的变化可以用图像的梯度反映，边缘检测就是求连续图像f(x，y

22、)梯度的局部最大值和方向。此项工作有利于以后的车牌定位和提取。只用边缘检测在图像受噪声影响较大时效果较差，为此本文设计了一种先检测边缘再串行连接成闭合边界的方法。2.1.3.3车牌定位功能模块车牌号识别系统的功能就是将车牌号中的文字识别出来，所以有用的图像信息就是车牌部分，车牌定位就是指将车牌区域从车辆图像中分割出来的过程。2.1.3.3.1水平垂直定位法1) 水平定位由车牌牌照的字符和背景的灰度比较大，对应于车牌区域的水平灰度变化就比较频繁，利用这个特点，考虑使用靠近水平方向的一阶差分运算，以突出灰度变化频繁的区域。其一阶差分运算的算式为见式（2-4）：（2-4）式中，i=1，2，3，m，

23、j-1，2，3，n，m为图像的高度，n为图像的宽度。再对水平差分图像g(x，y)的灰度值沿水平方向累加后做投影。水平方向累加后投影的算式见式（2-5）：（2-5）2) 垂直定位一般情况下，车牌的底色和车牌字符的颜色对比度较大，而且在一个相对较小的范围内变化比较频繁，所以我们可以通过这个特征来进行车牌的垂直位置定位。首先用下面这个处理函数来“放大”车牌的垂直边缘特征,见式（2-6）：（2-6）式中，S(x，y)为原图像，D(x，y)为处理后的图像，a为处理参数。2.1.3.3.2本论文中的车牌定位算法由于车牌的长宽比例固定这一特征，我设计了一种优化的算法就是在原基础上县进行垂直定位然后根据定

24、位后的长度计算出车牌的水平长度，这样的算法就简化了水平垂直定位算法。2.1.3.4车牌图像预处理功能模块2.1.3.4.1二值化子模块为了方便识别，需要将提取后的车牌图像进行二值化处理。灰度图像的二值化就是选定一个阈值T，如果图像中某像素的灰度值小于该阈值，则将该像素的灰度值设置为0；否则灰度值设置为249。从这个定义中我们可以看出图像二值化的关键在于阈值T的选取，根据阈值T来区分图像中的对像和背景。设原始灰度图像为f(x,y)，变换后的二值图像为g(x,y)，则二值化的过程可见式（2-7）：（2-7）其中阈值的计算方式至关重要，本系统中设计了下面的计算方法：阈值的定义就是把图像像素分成两个

25、类另,D0和D1，也就是物体和背景两个类别，D0 =（t+1,t+2,L-1）其中（0,L-1）为图像的灰度范围，其中D1=（0,t）。分别为类内方差，类间方差和总体方差。给定三个准则函数，见式（2-8）：（2-8）选取其中的一个准则函数，使此函数数值最小的t即为最佳阈值。2.1.3.4.2细化子模块由于我们的目的就是将车牌上的图像识别出来，所以只需要了解自负的骨架即可。图像细化就是把二值图像中具有一定宽度的线条状区域变成一条薄线(即只有一个像素宽度)。图像细化大大压缩了原始图像的数据量，并保持其形状的基本拓扑结构不变，从而为文字识别中的特征提取等奠定基础。细化的目的是要得到与原来区域形状近

26、似的，由简单的曲线组成的图形。经过细化的文字图像既保留了原文字绝大部分特征，有利于特征抽取，而且存储量比原文字二值化点阵要少得多，降低了处理工作量。2.1.3.4.3车边框的去除子模块在对车牌字符进行分割之前，先要去除车牌图像边框的干扰，对于标准车牌，字符间间距为12mm，第2、3个字符间间距为34mm，其中，中间小圆点l0mm宽，小圆点与第2、3个字符间间距分别为12mm。可以根据这些先验知识，对车牌图像逐行进行从内向外式扫描，当扫描到车牌图像某一行中，白色像素点的宽度大于某一阀值时(第一个符合条件的行)，则可以认为是车牌字符的边沿处，切除这一行以上或以下的所有行。本文设计的算法为：设要处理

27、的图片尺寸为m行n列取经验值9n/10行方向上投影的阈值，从2m/3行开始逐行向上扫描，如果该行在行方向上的投影大于阈值则从i+1方向上便为车牌边界，以上各行便可全部去除，如果没有则认为没有干扰。对于其他边框同样处理。对于车牌子图像不均匀的倾斜边框采取了以下方式进行去除：按照从左至右、从上至下、从右至左的的顺序进行图像扫描，只要遇到黑像素就把它转换成白像素，直到遇到白像素为止。2.1.3.4.4倾斜校正子模块由于拍摄时镜头与牌照的角度、车辆的运动及路面的状况等因素的影响，例如车牌在捕捉图像中的位置不固定，捕捉图像时镜头摆动或车牌本身倾斜等都可能使拍摄到的车牌图像有一定的倾斜度，为了正确识别需要

28、进行倾斜校正，否则将无法进行单个字符的正确分割，字符识别的误差率就会上升。目前处理这种问题的算法一般是Hough变换算法。Hough变换是对图像进行某种形式的坐标变换，它将原始图像空间中给定形状的曲线或直线变换成Hough空间中的一个点，从而将原始图像空间中给定曲线或直线的检测问题变成寻找变换空间的峰点问题口。Hough变换在待测直线具有小的扰动和断裂、甚至是虚线时，具有很强的检测能力。但是在很多情况下，由于车牌自身磨损或者光照等因素的影响，车牌区域的边框信息并不明显，甚至是很微弱。本文采用质心法进行车牌图像的倾斜校正，如图2-5所示。字符的质心是一个全局描述符，它的标是根据字符区域内所有属于

29、区域点的坐标而计算出来的，见式（2-9）所示，基于质心的方法是把字符的质心移动到指定的位置上。质心计算是全局性的，因此抗干扰能力强。（2-9）根据质心法进行倾斜校正的依据是图像左右两边的黑色像素的平均高度，如果是非倾斜的车牌图像，它的中心线左右两边的字符像素高度应该是处于水平位置附近的，如果两边字符像素的平均位置有比较大的起落，那就说明图像存在倾斜，需要进行调整，具体步骤是：1) 计算图像左半边和右半边的像素的平均高度H，见式（2-10）：（2-10）其中i为，j为，n为黑象素数量。2) 求斜率，见式（2-11）：（2-11）其中d为斜率，H1为左边高度，H2为右边高度，H3为图像高度

30、。3) 根据斜率重新组织图像，也就是从新图像到旧图像的映射。如果新图像中的像素映射到旧图像时超出了旧图像的范围，则把新图像中的该像素置成白色。2.1.3.4字符的提取功能模块字符提取（即字符分割）的任务是把多行或多字符图像中的每个字符从整个图像中切割出来成为单个字符。为了准确的把汽车牌照的单一字符提取分离出来，我们必须有效的利用汽车牌照的格式标准和字符排列信息。标准的车辆牌照(军车、警车、教练车、领事馆车除外)有七个字符，首位为省名编写(汉字)，次位为英文字母，接下来的五位或英文字母或阿拉伯数字。字符总长度为409mm，其中单个字符统一宽度为45mm，高90mm，第二、三个字符间间隔为34mm

31、(中间小圆点直径10mm，小圆点与第二、三个字符间间隔分别为12mm)，其余字符间隔为12mm。这些先验知识有助于单一字符提取。2.1.3.4.1字符提取一种比较简单的字符分割方法就是投影法，即根据字符在垂直方向投影的跳变来分割每个字符。由于考虑投影法的误差较大，所以本系统设计了一套算法如下：1) 先自下而上对图像进行逐行扫描直至遇到第一个黑色的像素点，记录下来。2) 然后再由上而下对图像进行逐行扫描直至遇到第一个黑色像素，这样就找到了图像大致的高度范围。3) 在这个高度范围之内再白左向右运列扫描，遇到第一个黑色像素时认为是字符分割的起始位置，然后继续扫描，直至遇到有一列中没有黑色像素，则认为

32、这个字符分割结束。4) 然后继续扫描，按照上述的方法一直扫描直至图像的最右端。这样就得到了每个字符的比较精确的宽度范围。5) 在已知的每个字符比较精确的宽度范围内，按照方法，分别进行自上而下和自下而上的逐行扫描来获取每个字符精确的高度范围。6) 最后用边框把每个字符的上，下，左，右界勾画出柬就完成了字符的分割。2.1.3.4.2字符归一化在字符识别过程中，字符的归一化是十分重要的。因为字符识别主要是基于字符的图形结构，脱离了规范化的字符图像，字符识别很难保证。事实上，字符识别的过程，就是以单个字符的点矩阵作为输入送入字符识别系统，最终得以分类和识别。如果不能将字符点阵在位置、尺寸和粗细上经规范

33、化而统一，字符点阵的相似性也就无从谈起。为了消除字符点阵位置上的偏差，需要将整个字符点阵图形移动到固定的位置上，这个过程被称为位置归一化。有两种简单的位置归一化方法，一种是基于质心的位置归一化；另一种是基于字符外边框的归一化。基于字符外边框的归一化方法是将字符外接边框按比例线性放大或缩小为规定尺寸的字符。另一种更为常用的方法是质心法归一化，做法是根据坐标(i，j)按照黑像素的分布进行尺寸归一化，首先将字符进行分割成几部分，然后以原字符质心作为归一化字符中心的字符位置，将字符的各个部分进行放大或缩小而成。原图像中的点(x0，y0)对应于新图中的点(x1，y1)的缩放，转换矩阵见式（2-13）所示

34、，其中Rx，Ry，Rz为缩放因子。（2-12）将字符统一标准为下一步字符的编码以及分类打下良好基础。2.1.3.5 字符识别功能模块2.1.3.5.1字符编码（特征提取）将图像字符按照一定的编码方式进行编码以便于下一步的字符分类，基本的编码方式有很多，如哈夫曼编码。字符编码其实就是将提取出的特征值编码成特征向量的过程以便下面对其进行分类。在字符识别中，广泛采用两种特征：结构特征和统计特征。结构特征包括外围轮廓特征、重心分布特征、径向编码以及特征点特征等与结构特征相比，统计特征用于识别具有良好的抗噪声、抗干扰的性能，其鲁棒性主要体现在统计特征的抽取和模式匹配方法上。本文根据识别字符的特点，设计

35、了一种独特的分析方法就是根据识别的字符分为汉字、字母、数字采用了不同的提取特征方式，比如对待数字采用一种特征提取方式，对待字母则采用另一种提取方式。在下面的关键算法中会详细介绍。2.1.3.5.2 字符的分类识别这一部是将编码后的字符通过设计的分类器进行比对分类，最终转化成可以输出的字符。当然事先要将输出的类别号或者编码号对应哪个字符。在这个模块中最重要的是分类方法的设计，目前基于图像分类的算法基本有两类模板匹配和人工神经网络。模板匹配即实现设计好各类，并求出其特征值，然后根据输入类的特征值进行聚类分析，从而达到分类的目的。神经网络的算法过于复杂，实现上困难比较大，所以我们在此采用模板匹配的

36、算法。分类后的字符根据分类结果输出到数据库中。关于模板匹配的具体算法在下面的关键技术中详细介绍。2.1.9技术措施根据C语言中的对矩阵处理的库函数以及图像转换库函数结合上述所述的算法进行各个模块的实现，此外还要用到数据库的设计，建立起一个图像数据库对字符分类器进行训练和判断。2.2方案实施所需的条件2.2.1技术条件结合图像处理算法用C语言设计实现，熟练掌握C语言，尤其是图像处理的部分。对模版匹配分类器的设计，掌握训练和设计方法。2.2.2试验条件1）硬件条件本系统的开发与实验，采用的机器硬件条件是如下几个方面。CPU：奔腾4 1.8GHZ以上（或AMD5000+以上）内存：1G以上硬盘：80

37、G以上2）软件条件在软件条件上，这个系统的开发与实验需要如下几个方面。操作系统：WindowsXP2000NTVista数据库：POSTGRESQ开发工具：Tubro C 2.3存在的主要问题和技术关键2.3.1 存在的主要问题本系统的设计涉及大量的数字图像处理，模式识别方面的算法，要用C言实现这些算法有一定的难度。尤其是分类器的设计。2.3.2 技术关键2.3.2.1模版匹配算法2.3.2.1.1 模板匹配算法的基本原理模板匹配是图像识别方法中具有代表性的基本方法之一，它是将待识别的字符图像或图像区域f(i,j)中提取的若干特征量与MN的模板图像T(i,j)中相应的特征量进行点对点比较，计算

38、它们之间规格化的互相关量，其中互相关量最大的一个就表示其相似程度最高，可将图像归于相应的类。模板匹配通常事先建立标准模板库，模板库中的标准模板通常是二值化的数字模板，(0表示背景，表示字符)并且图像模板大小相同。此方法实现简单，当字符较规整时对有少量缺损、污迹干扰等情况的字符图像其适应力比较强，但是对字符图像的旋转、缩放、倾斜、变形等情况的识别容忍度较低，很容易产生误识别。模式识别的方法有很多这些方法都是通过计算机。建立适当的数学模型来研究模式的自动处理和分类判别。在模式识别的各种方法中，模板匹配分类法是其中较经典的一种。其数学模型易于建立。同时模板匹配也是最原始、最基本的一种模式识别方法图像

39、的模板匹配就是事先给定一幅图像，然后到另一幅(或另一些)已知类别的图像中寻找待匹配图像；如果找到了，就是匹配成功。这看起来好像很简单，因为人类不仅具有视觉功能而且具有强大的学习、联想与辨别能力。对图像的匹配可以是整幅的图像问的匹配，即把未知图像和标准图像相比，看它们是否相同或者相似：也可以是一个较小的图像与一幅较大的图像中的一部分(子图像)进行的匹配。这里匹配的目的可分为两类：一类是确定两个整副图像之间是否匹配；另一类是确定小图像在大图像中是否存在以及存在时所处的位置。模板匹配分类方法是将样本训练库中的所有样本看作标准样板将待测样本与训练库中的样本逐个进行比较根据分类判别函数的计算结果，找出和

40、待测样本最相似、最接近的样本；同时将该样本的类别作为待测样本的类别。2.3.2.1.2字符分类过程模板匹配算法基本是用于图像分类，但是在字符分类中，我们已经提取出来了字符的特征值并进行了编码。这样就省略了一般模板匹配的前3个基本过程，直接对提取出来的特征值进行分类。分类的目的是：分析输人数据通过在训练集中的数据表现出来的特性为每一个类找到一种准确的描述或者模型。这种描述常常用谓词表示四。由此生成的类描述用来对未来的测试数据进行分类。尽管这些未来的测试数据的类标签是未知的但是仍可以由此预测这些新数据可能所属的类。同时也可以由此对数据中的每一个类有更好的理解或者说可以更多地获得这个类的知识。在图像

41、分类过程中首先找出描述并区分数据类或概念的模型(或函数)，以便能够使用模型预测类标记未知的对象类嗍。导出模型是基于对训练数据集(即其类标记已知的数据对象）的分析。导出模型可以用多种形式表示，例如决策树、If_1Ilen规则、神经网络或数学公式。分类是一类重要的数据挖掘问题，可描述如下：输人数据或称训练集它是一条条的数据库记录或相关的规则组成的：每一条记录包含若干个属性，组成一个特征向量(一般是多维的)；训练集的每条记录还有一个特定的类标签与之对应。该类标签是系统的输人通常是以往的一些经验数据。2.3.2.1.3匹配准则匹配准则即根据那种方式来确定每个提取特征后的字符图像分入哪类，例如字符“3”

42、是应该分入“3”这一类还是“4”这一类，模式识别中的分类方法不同的主要是采用的计算距离不同。比如明式距离还是马氏距离。不同的距离会产生不同的结果，这需要在反复的试验中最终确定一种方法。在确定了采用何种距离之后需要进一步决定用哪种分类方法。不同的分类方法也会对分类结果产生很大的影响。这里我们采用最小平均绝对差准则计算简单，效果也不错，文中就采用这种匹配准则15。其实，经过特征提取的字符图像数据就是一个向量，标准模板中的标准字符也是经过特征提取的向量，所以经过计算待识别字符的向量与标准字符的向量的向量距离（这里我们根据需要选择欧式距离），哪个距离最短就是属于哪个标准字符。这就是模板匹配的基本原理。

43、2.3.2.1.4匹配块的选择1) 块的大小。实验发现，三步搜索第一步采用1313的匹配块效果比较好。第二步和第三步采用55的匹配块即可。2) 块的位置。选用图像上固定位置处的图像块，图像块的中心呈均匀网格状分布。本方法一共选择1616个图像块，其中只要有50个位置匹配准确即可满足要求。而图像块的匹配准确率一般在5070之间，关键是如何找到准确匹配的位置。文中提出一个巧妙的数据处理方法，可以迅速找到匹配准确的图像块。2.3.2.1.5模板匹配的算法流程设输入字符用输入函数f(x,y)表示,标准模板用函数F(x,y)表示，在相关器中比较后输出为T(x,y)。当随机变量使用相关变量x1,x2,y1

44、,y2表示时，相关器输出为见式（2-13）：（2-13）当x1=x2，y1=y2时，见式（2-14）：（2-14）当f(x,y)=F(x,y)时，见式（2-15）：（2-15）即为输入字符的自相关函数，且有T(0,0)=T(x,y),T(x,y)在T(0,0)处出现主峰，在其他标准字符处出现一些副峰，只要这些副峰小于主峰，就可以通过适当的阈值将其鉴别，从而判断并识别出待识别的字符。这种判别方法在字符样本图像的形变不大的条件下，其错误概率和拒绝识别的概率最小。其流程图如图2-7所示：图2-6模板匹配算法流程图2.3.2.2.6本系统的模板匹配设计对于不同类型的字符，送入不同的分类器，提取

45、相应的字符特征。例如，车牌的第一个字符送人汉字分类器，提取相关的汉字字符特征，其中汉字字符特征也包括统计特征、结构特征、投影特征，依次第二个字符送入字母分类器，第五、六、七个字符送入数字分类器，由于车牌的第三、四个字符可能是字母也可能是数字，故这里采用串联的方式提取字符特征，先送入数字分类器提取字符特征，再送入字母分类器提取字母特征，然后综合两者的字符特征，进行字符特征匹配进行识别。每种分类器提取的字符特征是不一样的，但是种类是一样的，都包括统计特征、结构特征、投影特征。在以上的基础上提取了相关的字符特征信息后，就可以判断出字符，由于车牌在提取字符信息，由于外界环境的干扰，会提取出错误的特征或

46、者字符的所有特征没有被全部提取出来，故在判断字符的时候，采用模糊匹配的方法。字符识别结构图如图2-8。图2-7 字符识别结构图在识别车牌第二个字符的时候，首先把分割好的字符放入字母分类器，提取出相关的特征值，其中包括统计特征，结构特征，投影特征，对于字母E，统计特征包含特征l、特征6，结构特征为0210，投影特征采用与车牌字库中的汉字字符数据进行异或操作，在处理后，其中数据不为0的数量最少的即为对应字符。当特征提取不完全无法准确判断出字符时，采用模糊匹配方法，即加入权值，value=统计特征权值+结构特征权值+投影特征X权值。由于统计特征更能体现出字符特征，井在车牌字符识别试验的基础上，得出的值为value=统计特征0. 6+结构特征0 .2+投影特征0.2，取出识别字符多个value中的最大值的对应字符，识别字符即为该字符。2.3.2.3 特征提取由于本系统的分类器设计采用了多类型分类器的

展开阅读全文