碎纸片的拼接复原.docx

上传人:啊飒飒 文档编号:11612641 上传时间:2021-08-26 格式:DOCX 页数:37 大小:23.69KB
返回 下载 相关 举报
碎纸片的拼接复原.docx_第1页
第1页 / 共37页
碎纸片的拼接复原.docx_第2页
第2页 / 共37页
碎纸片的拼接复原.docx_第3页
第3页 / 共37页
碎纸片的拼接复原.docx_第4页
第4页 / 共37页
碎纸片的拼接复原.docx_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《碎纸片的拼接复原.docx》由会员分享,可在线阅读,更多相关《碎纸片的拼接复原.docx(37页珍藏版)》请在三一文库上搜索。

1、碎纸片的拼接复原摘要1. 问题重述破碎文件的拼接在司法物证复原、历史文献修复以及军事情报获取等领域都有着重要的应用。传统上,拼接复原工作需由人工完成,准确率较高,但效率很低。特别是当碎片数量巨大,人工拼接很难在短时间内完成任务。随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。请讨论以下问题:1. 对于给定的来自同一页印刷文字文件的碎纸机破碎纸片(仅纵切),建立碎纸片拼接复原模型和算法,并针对附件1、附件2给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果以图片形式及表格形式表达(见【结果表达格式说明】)

2、。2. 对于碎纸机既纵切又横切的情形,请设计碎纸片拼接复原模型和算法,并针对附件3、附件4给出的中、英文各一页文件的碎片数据进行拼接复原。如果复原过程需要人工干预,请写出干预方式及干预的时间节点。复原结果表达要求同上。3. 上述所给碎片数据均为单面打印文件,从现实情形出发,还可能有双面打印文件的碎纸片拼接复原问题需要解决。附件5给出的是一页英文印刷文字双面打印文件的碎片数据。请尝试设计相应的碎纸片拼接复原模型与算法,并就附件5的碎片数据给出拼接复原结果,结果表达要求同上。【数据文件说明】(1) 每一附件为同一页纸的碎片数据。(2) 附件1、附件2为纵切碎片数据,每页纸被切为19条碎片。(3)

3、附件3、附件4为纵横切碎片数据,每页纸被切为1119个碎片。(4) 附件5为纵横切碎片数据,每页纸被切为1119个碎片,每个碎片有正反两面。该附件中每一碎片对应两个文件,共有21119个文件,例如,第一个碎片的两面分别对应文件000a、000b。【结果表达格式说明】复原图片放入附录中,表格表达格式如下:(1) 附件1、附件2的结果:将碎片序号按复原后顺序填入119的表格;(2) 附件3、附件4的结果:将碎片序号按复原后顺序填入1119的表格;(3) 附件5的结果:将碎片序号按复原后顺序填入两个1119的表格;(4) 不能确定复原位置的碎片,可不填入上述表格,单独列表。2. 问题分析二值化 由于

4、文字识别只需要处理图像中的字型信息,对颜色等信息不做处理,所以二值化处理可以去掉不必要的信息,提高识别的速度。二值化处理是文字识别系统的首要步骤,二值化结果的质量将直接影响后续处理的效果,从而决定整个识别系统的性能指标。 因此,系统实现的首要步骤即为将文件资料扫描后的RGB图像资料通过matlab编程的方式实现向二值图像的转化。 由于文字图像的目标和背景非常清楚,因此,本文将采用全局二值化方法,全局阈值法根据文本图像确定一个阈值。 在此,可引入索引色图像的概念,即对不同颜色进行编号,组成一个调色板,图像数据记录像素对应的调色板颜色的序号。设原始图像的序号为f(x,y),在经历的图像灰度化的过程

5、中在f(x,y)中找到一个灰度值T作为阈值,分割后的二值图像g(x,y)的灰度值大于T值时,则g(x,y)=255(即颜色为白),否则g(x,y)=0,(即颜色为黑),其中T值为设定的阈值8。这种方法对于文字图像这种颜色较为单一而不丰富的情况较为有效。在matlab环境下实现二值化的命令可如下所示: I=imread(原始图像);%读取原始图片 J=rgb2gray(I);%图像灰度化 figure subplot(2,2,1),imshow(I),title(Origin Image);%显示原始图像 subplot(2,2,2),imshow(J),title(Grayed Image);

6、%显示灰度化后的图像 %选取阈值T对图像进行二值化处理%灰度值大于T的为白色,小于T的为黑色 K=find(J=T); J(K)=255; subplot(2,2,3),imshow(J),title(Binary Image);%显示二值化后的图像8 代码(1) 在实际操作中也可以利用bw=im2bw(I,0.5);即直接用matlab自带函数进行二值化处理。3. 符号说明4. 模型假设5. 模型的建立与求解5.1问题一的求解5.1.1问题一模型的建立 常规文档碎纸片计算机拼接方法一般利用碎片边缘的尖点特征、尖角特征、面积特征等几何特征,搜索与之匹配的相邻碎纸片并进行拼接,这种基于边界几何特

7、征的拼接方法适用于边缘形状相似的碎纸片。根据附件一、二中所给图片,我们可以看出图片只有黑白两种颜色,而且切割时由机器切割,每张图片的大小、形状基本一致。因此,本题的图像拼接不适合采用特征匹配法,只适合采用灰度拼接。灰度匹配的基本思想:将图像按像素放大后切割划分后,可看成是许多二维信号点,采用一定的方法寻找信号间的相关匹配。其基本原理是逐像素的把一个以一定大小的实时图像窗口的灰度矩阵,与参考图像的所有可能的窗口灰度阵列,按某种相似性度量方法进行搜索比较的匹配方法,从理论上说就是采用图像相关技术。本题首先将每张图片进行一种灰度二值化处理,将其转化为灰度矩阵。灰度二值化原理:将一幅具有多种灰度值的图

8、像变成白黑分布的二值图像的工作称为二值化处理。二值化的主要目的是将文字从图像中分离出来。通常的方法是比较像素值和阈值的大小,从而确定为1或0,这里二值化阈值的选取较为关键。灰度值,是指黑白相机(其实是灰度相机,真正的黑白,只有黑和白二值)拍出的图像某个像素坐标点的值。从0255共256级。看起来白的,值较大,接近或等于255,看起来黑的,值较小,接近或等于0。设灰度值为x,阈值为t:当xt时,并取值为1,代表白色;当xt时,取值为0,代表黑色。若阈值取的过大.则保留的信息过多,其中许多杂点无用信息造成了对以后处理的干扰,若阈取得过小,则丢失的信息过多,其中许多文字信息产生续断或丢失,造成最终文字提取分割的信息丢失。二值化处理 把文字图形带灰度电平的数字信号处理成二值(0,1)的数字信号,称为文字图形数字信号二值化(Binary)。对灰度图像二值化能显著的减小数据存储的容量,降低后续处理的复杂度。将文件资料扫描后的图像资料可以通过matlab编程的方式实现向二值图像的转化。转化后的灰度矩阵,我们在比较附件一、二的图片时,只需比较每张图片灰度矩阵得第一列和最后一列。当其中一张图片的灰度矩阵第一列与另外一张图片的最后一列每行的0、1值非常接近时,即可认为该两张图片可以匹配在一起。次过程可以通过matlab程序实现。其相关程序见附录 xxx 。6. 模型的优缺点7. 模型的评价和推广

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1