用深度学习技术解决图像语义分割问题.doc

资源描述

《用深度学习技术解决图像语义分割问题.doc》由会员分享，可在线阅读，更多相关《用深度学习技术解决图像语义分割问题.doc（2页珍藏版）》请在三一文库上搜索。

1、软件开发引言图像语义分割技术，即将给定图像的背景和目标物体区分开来，并单独加上语义标签，这在具体的图像处理中非常实用。1以往的图像语义分割技术原理是，先提取图像本身的特征，之后根据特征划分区域，再在区域上做特征提取，最后分类合并这些区域。其中研究投入最多的是特征提取，如涌现出的经典算法 HOG和SIFT，但其处理过程复杂不适用于所有图像问题。神经网络的出现，之所以能够掀起新一波的计算机视觉浪潮，就在于它的“端到端”处理机制，其无需再单独对图像做特征提取操作，多层卷积池化操作模拟人脑，在不断的抽象和迭代中做高层特征提取，再经过全连接层即可进行图像处理。图像语义分割作为子领域，将卷

2、积神经网络应用到其上，自然成为当前的研究热点。2006年以前，超过三层的神经网络模型效率低下，其后,Geoffrey教授在Science上发表的一篇关于深度学习的论文，再次引发了神经网络的研究热潮。该文章有两大观点：一是多隐含层的神经网络特征学习效果突岀，能学习到图像的本质特征；二是多层神经网络的优化复杂度可以通过“逐层初始化”得到克服。正是这两个核心观点的岀现加之研究学者的不断努力，使得神经网络攻克难以训练的危机，再次成为大数据和人工智能时代的主角。1.图像语义分割领域发展概述图像语义分割技术大大提高了图像检索的准确率。如根据医学影像做疾病检测方面，图像语义分割技术可以自动提

3、取医学领域关键信息，并依赖分类器做病症预判，最后再经由专业医生做决断，则一方面节省了人力物力财力，另一方面也避免了人为误判等情况的出现。该技术目标不仅仅在于图像分割，在此基础上还增加了新的要求，即语义标注，涉及到技术包括物体边界识别与类别检测。2基于区域的目标检测器，经典框架如下：用深度学习技术解决图像语义分割问题作者/蒋子源，浙江省杭州高级中学钱江校区摘要：大数据技术的飞速发展，使计算机视觉领域面临新的机遇和挑战。传统计算机视觉技术程序复杂，且需要专业知识背景支撑，严重阻碍了该领域的发展。神经网络技术的出现，人工智能产业的蓬勃发展，使得该领域焕然一新。本人在提炼总结大量参考文献的基

4、础上，对图像语义分割技术进行概述，并着重对卷积神经网络的的应用做深入剖析。首先就图像语义分割技术的概念、基本算法和具有应用进行综述，然后对卷积神经网络的发展和基础结构进行详述，之后就卷积神经网络算法如何应用在图像语义分割技术上做介绍，最后对该领域在医学图像和穿衣搭配领域的应用做研究。关键词：图像语义分割；卷积神经网络；深度学习；计算机视觉一，分割区域。依赖边界检测技术，要求该算法满足强不变性，即图像本身的亮度、大小、方位等信息并不影响边界检测结果；二，区域描述。依赖特征提取技术，需要提取到多方位特征。一是部分特征。如利用姿势模型提取目标物体形态特征。二是全局特征。包括纹理、颜色等

5、。三是轮廓信息。四是几何特征。包括边界、坐标等特征；、三，构造区域分类器。依赖SVM技术，计算各区域得分；四，转化与整合。将上述得分变为像素得分，并做基于像素的分类器，整合分割图。2.卷积神经网络技术原理与应用传统的图像处理技术主要包括特征提取和分类器两部分，特征提取算法的设计复杂性与应用局限性、稳定性，以及特定的特征提取算法与特定的分类器相结合的多样性限制着图像处理技术的发展。神经网络的岀现，使端到端的图像处理成为可能，当网络的隐藏层发展到多层时便称之为深度学习，但同时需要用逐层初始化技术解决深层次网络训练难度大的问题，之后深度学习便成为时代的主角。而卷积神经网络（CN

6、N ）便是深度学习与图像处理技术相结合所生的经典模型，实现该模型的网络实例在特定的图像问题处理上都卓有成效。神经网络之所以能和图像领域相结合，并呈现巨大的发展前景，是有生物学依据的。人类视觉信息处理机制的发现，是19世纪19年代生物学界的重大发现之一，它证明了大脑可视皮层是分级存在的。人的视觉系统是一个反复抽象和迭代的过程。而卷积神经网络，就模拟了这个过程。首先，每一个卷积层，便是将具体信息做抽象的过程，而多个卷积层串联操作，便是将上一层的抽象结果再做抽象处理的过程，称之为迭代。在这个抽象迭代的过程中，不断抽取大脑可感知的高维度特征。如当一幅图像经过视网膜进入视野，首先会将光线像素等信息抽象为图像边缘信息，然后再抽象为目标物体的某一部位，再抽象为物体轮廓形成对整个目标的感知。39

展开阅读全文