基于BP神经网络的字母识别系统设计与实现.doc

上传人:爱问知识人 文档编号:5095048 上传时间:2020-02-01 格式:DOC 页数:43 大小:567.50KB
返回 下载 相关 举报
基于BP神经网络的字母识别系统设计与实现.doc_第1页
第1页 / 共43页
基于BP神经网络的字母识别系统设计与实现.doc_第2页
第2页 / 共43页
基于BP神经网络的字母识别系统设计与实现.doc_第3页
第3页 / 共43页
基于BP神经网络的字母识别系统设计与实现.doc_第4页
第4页 / 共43页
基于BP神经网络的字母识别系统设计与实现.doc_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《基于BP神经网络的字母识别系统设计与实现.doc》由会员分享,可在线阅读,更多相关《基于BP神经网络的字母识别系统设计与实现.doc(43页珍藏版)》请在三一文库上搜索。

1、济南大学泉城学院毕 业 论 文题 目 基于BP神经网络的字母识别系统 设计与实现 专 业 电气工程及其自动化 班 级 07Q2 学 生 学 号 指导教师 二一一年六月七日济南大学泉城学院毕业论文摘 要基于前向反馈神经网络的字母识别技术在科学技术日新月异的今天迅速得到发展,在诸多的方面得到应用包括出版、金融、军事、现金登记、页面浏览以及任何带有重复性、变化性数据的文件。英文字母识别系统的设计经过以下几个过程:预处理、特征提取、BP神经网络的训练、识别。本文的重点在于BP神经网络。本文运用的是三层神经网络,输入层、隐含层、输出层。隐含层节点的确定本文给出了多种方法,本文运用了根值的方法。基于人工神

2、经网络字母识别的特点和优越性,主要表现在三个方面:第一,具有自学习功能。字母识别时,只在先把许多不同的图像样板和对应的应识别的结果输入人工神经网络,然后在识别之前对神经网络进行训练形成稳定的权值这样网络通过自学习功能,慢慢学会识别类似的图像。第二,具有联想存储功能。用人工神经网络的反馈网络在字母识别时可以实现这种联想。第三,具有高速寻找优化解的能力。字母识别时寻找一个复杂问题的优化解,往往需要很大的计算量,利用一个针对某问题而设计的反馈型人工神经网络的字母识别系统,发挥计算机的高速运算能力,可能很快找到优化解。本文是在matlab环境下模拟整个英文字母的识别过程,随着科学技术的发展识别技术更加

3、成熟,各种难题都将会得到解决。关键词:字母识别;图像处理;特征提取;BP神经网络- 38 -ABSTRACTToday the science and technology develop rapidly. Letter recognition technology based on the feedback neural network is applied in many aspects including publication, finance military, cash register, page views, and any with repeatability,and var

4、iability of data files . Letter Identification System include the following processes: preprocessing, feature extraction, BP neural network training,and recognition. In this paper, we use a three-layer neural network, including input layer, hidden layer and output layer. This paper supply of a varie

5、ty of methods to determine Hidden layer nodes . The root sign method and other method.that proposed by the Nelson and Illingwnrth are applied .The features and advantages of Artificial neural network is reflected in three aspects :First, a self-learning function. When we recognize letters, only putt

6、ing many different images and the corresponding results into the artificial neural network and forming a stable weight before the letter recognition,the network will be through self-learning function to slowly identify similar images.Second, with the association storage. Artificial neural network fe

7、edback network can achieve this association in the letter recognition. Third, finding the optimal solution with high capacity. Finding the optimal solution of a complex often require a large amount of computation.Using a design that a feedback type artificial neural network for problem and playing t

8、he high-speed computing power of computer, you may quickly find the optimal solution. In the matlab environment this article simulate the entire process of letter recognition, with the development of science and technology recognition technology is more mature and have various problems will be solve

9、d.字典Keywords:Letter identification;image processing;feature extraction;the feedback neural network目 录摘 要IABSTRACTII1 前言11.1 研究背景及意义11.2 研究现状21.3 手写字母识别方法31.3.1 结构模式识别方法31.3.2 统计模式识别方法31.3.3 统计与结构相结合的识别方法41.3.4 人工神经网络方法41.4 识别系统性能的评价51.5 论文组织结构52 预处理62.1 系统框架62.2 预处理概述62.3 本文预处理设计62.3.1去噪72.3.2二值化82.

10、3.3 归一化102.3.4细化113 字母特征提取133.1 特征提取概述133.2 本文特征提取设计133.2.1像素百分比特征143.2.2提取矩阵的粗网格特征153.2.3 重心特征163.2.4 提取图像的矩阵像素特征163.2.5笔划特征173.2.6 外轮廓特征提取184 BP神经网络194.1 人工神经网络194.2神经网络的模型图204.3 BP神经网络的工作原理214.4神经网络的各层节点数224.4.1输入层和输出层224.4.2 隐含层节点数的优化确定234.5 BP神经网络的参数设计和训练过程17255 实验结果及分析285.1 实验设计285.1.1 实验参数285

11、.1.2 训练和识别样本库设计285.2隐含层节点对实验结果的影响285.2 识别样本的正确率305.3 实验结果分析31结 论32参 考 文 献33致 谢35附 录361 前言1.1 研究背景及意义手写字母识别技术是光学字符识别(Optical Character Recognition ,简称OCR)的一个分支,字母识别的研究背景要追溯到早期的光学识别技术,距今已有40多年的发展历史。早在6070年代,世界各国就开始有关于OCR的研究,而在研究的初期,多以文字的识别方法研究为主线,且识别的文字仅为09的数字。以同样拥有方块文字的日本为例子,其开始的光学字符识别技术走在世界前列,1960年左

12、右开始研究光学字符识别的基本识别理论,在初期以数字为对象,直到1965至1970年之间开始有一些简单的产品,例如印刷文字的邮政编码识别系统,识别邮件上的邮政编码,帮助邮局作区域分信的作业活动;因此至到今天邮政编码一直是各国所倡导的地址书写方式。BP神经网络手写字母识别技术的研究有着重要的意义。神经网络可以用于分类、聚类、预测等诸多领域。识别技术用于计算机的数据自动输人,早期的识别系统被用于大量形式多样的数据输人方面,比如处理汽油借记卡等。这种应用能够从非打印卡的账号中辨认购买者。早期的设备与打孔处理器一起来使用,伴随着计算机和识别系统精密程度的提高。识别的浏览器能够直接访误码CPO,这项技技术

13、也影响到了信用卡交易的付款处理的过程。目前,这些项应用仍是识别领域最主要用途之一。英语是世界上使用人数最多的文字之一。快速高效地将字母输人计算机,是信息处理的一个关键问题。人工键入速度慢而且劳动强度大,对于大量已有的文档资料,英文自动识别输人就成为了最佳的选择。它在英文信息处理、办公室自动化、机器翻译、人工智能等高技术领域,都有着重要的实用价值和理论意义。对于印刷体字符,首先采用光学的方式将文档资料转换成原始黑白点阵的图像文件,然后通过识别软件将图像中的文字转换成文本格式,以便文字处理软件的进一步加工。英文字符识别是模式识别的一个重要分支,也是文字识别领域比较困难的问题,它涉及模式识别、数字信

14、号处理、图像处理、人工智能、模糊数学、计算机、信息论、中文信息处理等诸多学科,是一门综合性的技术。近几年来,印刷英文字符识别系统的单字母识别正确率已经超过90.5,为了进一步提高系统的总体识别率,扫描图像、图像的预处理及识别后处理等方面的技术也都得到了深入的研究,并取得了很大的的进展,有效地提高了印刷字母识别系统的总体性能研究英文字母识别的BP神经网络模型,最终目的就是要使BP字母识别系统实现工业化,能像现在的一些手写英文字母识别系统或印刷体英文字母识别系统一样成为产品走向市场。字母识别固然有很多难题,但是相信随着科学计算机技术、人工神经网络技术的快速发展以及人脑功能的进一步揭示,英文字母识别

15、的理论和方法必将有大的飞跃.结合人工神经网络的发展史,我们有着对BP神经网络的展望。虽然神经网络的理论研究有着广阔的发展前景,但是每个领域的研究就是既充满诱惑又充满挑战. 没有人可以肯定告诉我们它的发展不会再经受挫折,也没有人会知道一旦成功实现其最终的目标会给世界带来多大的巨变. 但是我们有理由相信坚持不懈地致力于BP神经网络理论方法研究必定会给21 世纪科学研究带来辉煌。1.2 研究现状于21世纪40年代早期人工神经网络在国外率先得到发展。下面将以时间为顺序,以著名的人物或某一方面的突出研究成果为线索,简要介绍人工神经网络的发展历程。在1943年,WMcculloch和WPitts通过分析、

16、总结神经元的特性的基础上提出了神经元的数学模型。该模型一直沿用至今,并且一直影响该领域研究的进展。因而,称二人为人工神经网络研究领域的标志人物。1982年,美国加州工物理学院J.J.Hopfield提出了Hopfield神经网格模型,引入了“计算能量”的概念,给出了网络稳定性判断。 1984年,他又提出了连续时间Hopfield神经网络模型,为神经计算机的研究做了开拓性的贡献,开创了神经网络用于联想记忆和优化计算的全新的途径,有力地推动了神经网络的研究发展,1985年,又有学者提出了波耳兹曼模型,在学习中采用统计热力学模拟退火技术,保证整个系统趋于全局的稳定点在日本的“真实世界计算”项目中,人

17、工智能的研究成了一个重要的组成部分。1 我国在识别领域的研究起步较晚,在20世纪70年代才开始对符号、字母、数字进行识别研究,对汉字的识别研究开始于70年代末期,到86年我国汉字的识别研究进人一个跨越性的时期,并取得了丰硕成果,并相继推出了许多中文识别的实用产品。我国的许多研究部门在80年代初期就开始对字符识别进行研究,从80年代开始,神经网络的识别研究开发就一直受到国家“863”计划的资助与支持,并已经有了初步的回报。排列浏览方法以及高速计算机的出现,产生了图像处理过程这一概念。“图像处理过程”并不要求BP识别成功地派上用场,例如,BP神经网络系统将文件转变成电子数字条目的能力,将有效地取代

18、显微胶片。相对于处理现实中的文件式显微胶片的图片,这种系统能力为用户提供了更方便地整理图像的方法。当通过上述的排列浏览方法生成识别逻辑单元后,图像处理可以采用“离线”方式而不是过去的实时方式。这是区别早期识别系统的最大的优点,现在的识别系统能够允许强有力的逻辑系统持续工作,并不再对要浏览的字符的大小字体及数据位置两方面信息作出的要求。譬如金融服务业的支票处理服务的“便捷图像数据辨别”就是这样的。1.3 手写字母识别方法英文字母的结构表达形式和相应的单词形成方法有多种,每种结构形式又可以选择不同的特征,并且特征有不同的抽取方法,这样识别算法、标准、举学工具也不相同,这就造成了英文字母识别的算法种

19、类繁多,结构不尽相同。因此,不同特征提取特征和神经网络的设计方法决定了识别系统所用得处理方法。通常可以分为统计模式方法、结构模式方法、统计与结构相结合的方法和人工神经网络方法.1.3.1 结构模式识别方法运用模式的基元和基元间的结构关系对模式描述与识别。在很多情况下,可以运用形式语言理论中的文法对模式的结构内容进行表示,有时也称其为句法模式识别。预处理、文法推断、模式表达、句法分析四个部分(如图1.1)构成了结构模式识别系统。输入模式 分类及描述句法分析模式表达预处理样本模式文法判断图1.1,句法模式识别框图1.3.2 统计模式识别方法广义地说,存在于时间和空间中可以观察的事物,如果可以区别它

20、们是否相同或相似,都可以称为模式;狭义地说,模式是通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息;把模式所属的类别或同一类中模式的总体称之为模式类(又简称为类)。而“模式识别”则是在某些一定量度或观测基础上把待识模式划分到各自的模式类中去。31对模式的统计分类方法,即把模式类看成是用某个随机向量实现的集合,又称为决策理论识别方法。属于同一类别的各个模式之间的差异,部分是由环境噪声和传感器的性质所引起的,部分是模式本身所具有的随机性质。前者如纸的质量、墨水、污点对书写字符的影响;后者表现为同一个人书写同一字符时,虽形状相似,但不可能完全一样。因此当用特征向量来表示这些在形状上稍有差

21、异的字符时,同这些特征向量对应的特征空间中的点便不同一,而是分布在特征空间的某个区域中。这个区域就可以用来表示该随机向量实现的集合。模式识别系统在进行工作时只要判断被识别的对象落入哪一个区域,就能确定出其所属的类别。1.3.3 统计与结构相结合的识别方法统计与结构相结合的识别方法能够很好的解决字符正确识别率的问题,结构识别方法和统计识别方法分别应用在识别的不同层次上。统计识别用于基元的提取上二结构识别用于整体符号的识别上,我们可以分为以下几步:(1)符号处理:用细化和归一化对待识字符进行处理。(2)基元提取:利用神经网络和Freeman分别生成节点基元集合和连线基元集合,他们组成了符号基元集合

22、(3)符号文法:利用得到的符号基元集合来建立符号的有向图的表示法再利用图的遍历算法遍历所有节点形成符号句再用模糊度形成三级模糊度符号句子。(4)句子匹配:对符号的三级模糊度进行匹配进而得到识别结果。61.3.4 人工神经网络方法人工神经网络(ArtificialNeuralNetworks,简写为ANNs)也简称为神经网络(NNs)又称作连接模型(ConnectionistModel),它模范动物的神经网络行为特征,是一种分布式并行信息处理的算法模型。该网络通过调整内部节点间相互的连接关系,进行信息处理。人工神经网络具备自学习和自适应能力,通过先前提供的大量的输入数据,进行分析,掌握输入输出之

23、间内在的规律,最终利用这些规律,利用提取得到的新数据来计算输出结果,这种学习分析的过程被称为“训练”。人工神经网络包括LMBP神经网络、GA神经网络、BP神经网络等多种神经网络。81.4 识别系统性能的评价衡量一个BP神经网络系统性能好坏的主要指标有:正确识别率(正确识别率 = 正确识别样本数/ 全部样本数*100 %)、错误识别率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等诸多方面。对神经网络的研究目前许多技术不能确定,正确率永远达不到100%,只能靠近,它们之间进行着拉锯战。由于与很多因素有关,比如作者的书写习惯、扫描的质量、识别运用的算法、学习与训练的样本等,都可能影响识

24、别正确率,所以 BP神经网络产品不但需要一个核心技术,产品的操作使用方便性、所提供的除错功能及方法,也是决定产品好坏的重要因素9。1.5 论文组织结构手写字母识别是指利用BP神经网络辨认手写英文字母的一种技术,它属于OCR范畴。基于BP网络的手写英文字母识别包括两个阶段:一个是训练阶段和一个是识别阶段,这两个阶段包含输入、预处理、特征提取、分类及输出五个部分。本文将通过五章地内容进行讨论,用MATLAB仿真得到实验数据并对全文进行总结。第一章前言当中介绍了手写体数字识别的研究背景与意义、现状、手写字母的四种实现方法,对识别系统性能的评价第二章讨论了手写英文字母识别的预处理方法,包括图像的去噪、

25、二值、归一化、细化。图像预处理的本质是:特征提取时提取的字母特征能有效地反映手写英文字母的本质特征。本章中介绍了预处理的不同方法,并详细分析各阶段的显现过程。第三章主要讲述英文字母的特征提取,介绍了提取的特征即实现方法。本文选取的特征包括重心、像素百分比密度特征、矩阵变换特征、粗网格特征、外轮廓特征笔划密度特征六种方法。第四章介绍分类器的设计原理和实现算法,指出BP网络用于手写字母识别参数选择。并结合提取的特征向量,确定本文采用的BP网络的网络模型。第五章对实验结果进行了分析。指出了影响正确识别率的几个潜在的机理。第六章对本文所作的工作进行总结,并提出BP神经网络识别的工作展望。2 预处理2.

26、1 系统框架基于BP神经网络的手写英文系目的识别过程分为学习阶段和识别阶段,学习阶段和识别阶段都要对样本字母进行预处理、特征提取,学习阶段还要进行训练确定稳定的权值,识别阶段还要经过分类在输出识别结果。样本字母预处理特征提取训练模式待识字母预处理特征提取分类结果输出学习阶段识别阶段图2.1系统的识别框架图2.2 预处理概述在进行手写英文字母识别时需要对所得到的手写英文字母图像提前进行预处理,不同地域的人在书写英文字母的过程中的书写风格不尽相同即使是同一地域的人由于山谷写的任意性也会造成手写字母的形式千变万化,令外数字图像在采集过程中,受图像质量、扫描性能的影响,数字图像会带有形变和噪声,这些变

27、化都会影响英文字母的识别效果,预处理的目的是消除原始图像中的噪声,将原来的图像转化为清晰的二值化图像,便于对手写字母的微观结构特征的提取。因此预处理过程的效果会对特征的提取、数字识别产生重要的影响。本文采用的的字母图像的预处理过程:去噪、二值化、归一化和细化。2.3 本文预处理设计本章的预处理过程的设计如图2.2所示:字母图像的预处理字字母去噪处理字字母二值化处理字字母归一化处理字字母细化处理图2.2 预处理过程2.3.1去噪我们得到的原始图像应书写风格的不同,外部环境的影响往往存在个别的孤立点,这就是我们说的噪音。这些孤立的点在图像中是我们不想要的,必须进行去除才能提高英文字母的识别率,如何

28、进行去噪本文涉及两种方法。(1)均值滤波:均值滤波是一种典型的线性滤波方式,它的工作原理是对于目标像素存在一个模板,在这个模板中包括目标像素周围的8个像素点,用着八个像素点的灰度平均值来代替目标像素点的灰度值。均值滤波采用的主要是平均法,因此均值滤波又叫线性滤波,它是用周边像素点G1(x1,y1)至G8(x8,y8)(G代表灰度)的平均灰度来代替当前像素点G(x0,y0)的灰度值,m为模板周围像素点的个数15。(2)中值滤波:相对于均值滤波来说中值滤波是一种非线性的滤波方式,它是图像预处理中有效地去噪方式,被广泛的应用。中值滤波的工作原理:用一个奇数的移动窗口,某一点的值是该奇数窗口中所有像素

29、点的中间值,比如说,假设窗口内有七点,其值为70、80、90、200、115、120和210那么此窗口内各点的中值及为115。那么中值滤波的具体实现形式又是什么呢?我们设一个一维序列的数组f1,f2,fn,取移动窗口的长度为m(当然m为奇数),我们,对其进行中值滤波时,就是从我们选定的序列中连续抽出m个数fi-a,fi-1,fi,fi+1,fi+a(fi为窗口的中心值,a=(m-1)/2),再将这m个点按其数值大小进行排序,数值顺序单调上升或单调下降,取其序号的中心点的那个数作为滤波输出。设模板窗口像素点的个数为5灰度值分别为0、8、4、6、2经过中值滤波函数filter后输出序列外0、2、4

30、、6、8 在去中间值为4,则5个像素点G(x1,y1)-G(x5,y5)的灰度值为5。均值滤波和中值滤波的比较:对于均值滤波把目标像素点都用模板周围的8个像素的灰度均值来代替。可以有效地对图像进行平滑并且速度快,算法简单。但是无法有效地去除噪声,只能微弱的减弱噪声。而对于非线性滤波方法也就是我们说的中值滤波 ,它是图像预处理技术中最常用的核心处理技术。它在平滑去除噪声方面十分有效,并且它能够保护图像尖锐的边缘。所以均值滤波和中值滤波都有各自的利与弊,选用哪一种滤波方式这要看我们对识别的要求。如果是用在要求识别速度快但对正确率要求必是很高的场合我们可以选择运用均值滤波的方式,如果使用在要求高正确

31、率的场合,比如银行、金融业,我们就必须运用中值滤波来实现。本文要求较高的识别率选用了中值滤波来实现英文字母的识别。对C进行滤波前后的对比如下图: 滤波前 滤波后图2.3手写字符滤波前后比对图2.3.2二值化在数字图像的处理当中,二值图像有着非常重要的地位。第一,图像二值化后有利于图像的进一步处理,使图像变得简单,而且整体数据量减小,能凸显出的图像的整体轮廓。第二,要进行二值图像的处理与分析,首先要把0-255的灰度图像进行二值化,得到二值化图像。图像的二值化就是将图像上的像素点的灰度值设置为0或1,0代表白色(或黑色),1代表黑色(或白色)也就是将整个图像呈现出灰度为0或255明显的黑白效果。

32、二值化在matlab中是如何实现的呢?256个亮度等级的灰度图像经过选取适当的阀值而仍然可以获得反映图像局部和整体特征的二值化图像。 (2.1)如公式(2.1)所有灰度大于或等于选定阀值T,即 (x,y) =T ,的像素被判定为属于特定物体,其灰度值变为255用1(或0)来表示,否则,即 (x,y)T这些像素点被排除在物体区域之外,灰度值为0,用0(或1)来表示,表示背景或例外的物体区域。图像的二值化过程运用了许多的算法大体可以分为两类一类是全局阀值;一类是局部阀值。对于全局阀值来说选取阀值T整幅图像当中凡是大于阀值T的均为1,相反只要小于阀值T则为0二对于局部阀值来说首先要对图像进行分割,每

33、一部分的阀值T是不一样的实质就是进行图像的局部二值化。有效地确定阀值所得到得二值化图像可以提高英文字母的正确识别率。最大类间方差方法是二值化全局阈值算法的最为杰出的代表之一。它是由Otsu于1979年提出的一种基于判别式分析的方法。基本想法是以最佳门限将图像灰度直方图分割成两部分,使两部分类间方差取最大值,即分离性最大。把图像中的像素按灰度级阀值T分成两大类C0和C1C0=(0、1T)C1=(T、T+1255)若用2w 、2B、2T表示示类内、类间和总体建立三个函数式11: (2.2)则最优值 (2.3)TE 0,1,L-1 运用这种方法计算简单,稳定且有效,是实际应用中经常采用的方法之一。我

34、们用这种方法确定了阈值是0.7,如图2.3所示二值化前后的图像: 二值化前 二值化后图2.4二值化前后图像对于我们要鉴定的字母二值化前后的字母矩阵是什么变化呢?以125为阈值举例,运行程序后字母矩阵得到如下表结果表2.1字母二值化前后的矩阵(a)二值化前 (b)二值化后4578221789047217852340481281781272912826490179941249387100100010100111010001000002.3.3 归一化我们所要鉴定的字符的大小规格不尽相同,这对后续英文字母的特征提取,识别操作环节会造成一定的障碍。将每个数字图像统一到同一的高度和宽度,这就是图像的归一

35、化。基本上归一化思想是利用图像的不变矩寻找一组参数使其能够消除其他变换函数对图像变换的影响。也就是转换成唯一的标准形式以抵抗仿射变换。还有一种归一化思想在matlab里图像数据有时候必须是浮点型才能处理,而图像数据本身是0-255的UNIT型数据所以需要归一化,转换到0-1之间。归一化使得所有的图像在识别之前都在同一个起跑线是为了加快训练网络的收敛性,归一化的具体作用是归纳统一样本的统计分布性。归一归一化有同一、统一和合一的意思。无论是为了建模还是为了计算,首先基本度量单位要同一,神经网络是以样本在事件中的统计分别几率来进行训练(概率计算)和预的。本文采用的是尺寸上的归一花,归一化通常有两种形

36、式:一种是外轮廓归一化,另一种是重心的一化可以得到笔划均匀分布的图。重心到中心归一化后的坐标由式12: (2.4)公式当中:w为图像的宽度,h为图像的高度外轮廓归一化的原理是利用图像的伸缩性得到一定尺寸的图像.具体的算法如下:首先得到原来字符的高度,并与系统要求的高度进行比较,得到长或宽的变换系数,然后根据得到的变换系数求得图像变换后的宽度和高度。在得到宽度和高度之后,把新图像里面的点映射到原图像中。归一化把原始的图像放大成一个相同规格的全新的字符图像,其中新增加的像素其灰度值只是基于原始字符图像所派生出来的,所以图像的信息量并未增加,但使得图像更易于处理有利于提高识别率。归一化前后的对比字符

37、(如下): 图2.5 归一化前 归一化后2.3.4细化在样本图像的识别过程当中细化处理能够有效的提高字符的识别率,图像的细化过程实际上就是图像的核心骨架的提取过程。因为在识别过程当中印刷体和手写体对识别正确率有影响,不同的英文字体以及不同人的书写形式都对识别的正确率产生重要的影响,但是每个英文字母的核心骨架是不会有很大的变化,这样字符的细化处理可有效的消除这种不利的影响提高是别的正确率。细化的算法有两种:一种是非迭代一次细化完成,如图(2.6细化后图像);一种是迭代N次细化完成。细化就是就是在保留原始图像的拓扑结构的基础上尽可能的消去二值图像边缘的像素将待识别字符的宽度减少为1,即为单像素宽度

38、,这个过程就是字符的细化。对字符进行细化的过程当中我们选取算法是要有一定的准则:(1)细化算法不应该改变待识字符的连续性。(2)细化算法不应该去除重要点例如拐点。(3)算法不应该对噪声敏感,即当待识字符边界上出现噪声时,对细化结果不产生影响。(4)细化后的图像要有效地保留原图像的核心骨架结构,比如保留细化前图像的拓扑结构等。细化前后我们用简单的二值化矩阵(如下)举例来表示:Example:L =0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0

39、 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 1 0 Result: L0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 1 1

40、0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 图2.6细化后的图像经过上述预处理:平滑滤波去噪、二值化、大小归一化四个过程,我们所得到的新图像具有鲜明的特征,使得所有图像处在了同一个起点上,为第三章讲述的特征提取创造了条件。3 字母特征提取3.1 特征提取概述特征提取指的是使用计算机提取图像信息,来决定每个图像的点是否属于一个图像特征。特征提取就是把图像上的点分成不同的区域子集,这些子区域往往属于孤立的点、连续的曲线或连续的区域。在字符的识别当中,特征的选择是一个关键问题。对于某一具体的识别应用,所选择的特征往往会影响最终的正确识别率。因为在很

41、多实际应用问题中往往不容易找到字符最重要的特征,或受某些条件限制不能对它们进行实际的测量,这就使的特征选择和提取的任务非常的困难,所以特征的有效选择成为字符识别系统最困难的任务之一。本文识别的对象是手写体的英文字母,属于字符识别的领域。字符的特征可以分为两大特征,一:结构特征二:统计特征。结构特征提取的重点是要确定以基元像素值表示出来的的结构信息,主要有轮廓、笔画、骨架等结构特征。本文用到了结构特征中的外轮廓特征和笔画特征以及重心特征。统计特征是指从原始数据图像中提取与分类最相关的信息,使各类之间的差距极小,类间差距极大。这里提到的统计特征应对同一类字符的形变最大化的保持不变。统计征可以分为全

42、局特征和局部特整。本文用到了像素百分比的全局特征和粗网格的局部特征提取。一个好的识别系统,应该符合以下条件:(1) 具有较好的平移不变性、旋转不变性和尺度不变性;(2) 稳定性好,具有较好的抗噪能力;(3)具有较好的类内一致性和类间区分度。本文为了对神经网络进行训练以后提高字符的识别率。下面就对这种基于结构和统计特整提取进行详细的介绍。3.2 本文特征提取设计特征提取的原则是所选用的特征能过很好的反应字母本身的特点,一般噪声不会影响字母选取的的结构特征或者说较小的形变或噪声在统计特征中的百分比很小。本文结合结构特征和统计特征采用了多种提取方法,通过matlab自编程序采用的结构特征包括:重心特征、笔画密度特征、外轮廓特征,统计特征包括:像素百分比特征、矩阵像素特征、粗网格特征,共六种特征,如图3.1所示:字母特征结构特征统计特征重心特征心笔画密度特征外轮廓特征像素百分比特征粗网格特征矩阵像素特征图3.1字母提取特征3.2.1像素百分比特征像素百分比特征是指在二值化图像当中所有的白像素点(或黑像素点)占整幅图像像素点的比例。本文采用的是黑像素点的比例。因为不同的英文字母笔画不同在归一化之后黑像素点的比例有很大的变化,所以

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 绩效管理


经营许可证编号:宁ICP备18001539号-1