2018年神经网络+数学建模型及算法张凯兵新-文档资料.ppt

资源描述

《2018年神经网络+数学建模型及算法张凯兵新-文档资料.ppt》由会员分享，可在线阅读，更多相关《2018年神经网络+数学建模型及算法张凯兵新-文档资料.ppt（79页珍藏版）》请在三一文库上搜索。

1、一、引例,1981年生物学家格若根（W Grogan）和维什（WWirth）发现了两类蚊子(或飞蠓midges)他们测量了这两类蚊子每个个体的翼长和触角长，数据如下：,翼长触角长类别 1.64 1.38 Af 1.82 1.38 Af 1.90 1.38 Af 1.70 1.40 Af 1.82 1.48 Af 1.82 1.54 Af 2.08 1.56 Af,翼长触角长类别 1.78 1.14 Apf 1.96 1.18 Apf 1.86 1.20 Apf 1.72 1.24 Af 2.00 1.26 Apf 2.00 1.28 Apf 1.96 1.30 Apf 1.74 1.3

2、6 Af,问：若抓到三只新的蚊子，它们的触角长和翼长分别为(1.24,1.80); (1.28，1.84)；（1.40，2.04）问它们应分别属于哪一个种类？,把翼长作纵坐标，触角长作横坐标；那么每个蚊子的翼长和触角决定了坐标平面的一个点.其中 6个蚊子属于 APf类；用黑点“”表示；9个蚊子属 Af类；用小圆圈“。”表示得到的结果见图1,图1 飞蠓的触角长和翼长,一、引例,1989年美国大学生数学建模问题,思路：,例如；取A（1.44，2.10）和 B(1.10，1.16)，过A B两点作一条直线： y 1.47x - 0.017 其中x表示触角长；y表示翼长,分类规则：设一个蚊子的数据为

3、（x, y）如果y1.47x - 0.017，则判断蚊子属Apf类；如果y1.47x - 0.017；则判断蚊子属Af类,一、引例,作一直线将两类飞蠓分开,分类结果：(1.24，1.80)，(1.28，1.84)属于Af类；(1.40，2.04）属于 Apf类,图2 分类直线图,一、引例,缺陷：根据什么原则确定分类直线？,若取A=(1.46,2.10), B=(1.1,1.6)不变，则分类直线变为 y=1.39x+0.071,分类结果变为： (1.24,1.80)， (1.40,2.04) 属于Apf类； (1.28,1.84)属于Af类,哪一分类直线才是正确的呢？,一、引例,A（1.44

4、，2.10）,再如，如下的情形能不能用分类直线的办法呢？,新思路：将问题看作一个系统，飞蠓的数据作为输入，飞蠓的类型作为输出，研究输入与输出的关系。,一、引例,人工神经网络模型,前言,所谓人工神经网络就是基于模仿生物大脑的结构和功能而构成的一种信息处理系统。粗略地讲，大脑是由大量神经细胞或神经元组成的。每个神经元可看作是一个小的处理单元，这些神经元按某种方式连接起来，形成大脑内部的生理神经元网络。这种神经元网络中各神经元之间联结的强弱，按外部的激励信号做自适应变化，而每个神经元又随着所接收到的多个接收信号的综合大小而呈现兴奋或抑制状态。,生物神经网,基本工作机制：一个神经元有两种状态兴奋

5、和抑制平时处于抑制状态的神经元，当接收到其它神经元经由突触传来的冲击信号时，多个输入在神经元中以代数和的方式叠加。进入突触的信号会被加权，起兴奋作用的信号为正，起抑制作用的信号为负。如果叠加总量超过某个阈值，神经元就会被激发进入兴奋状态，发出输出脉冲，并由轴突的突触传递给其它神经元。,人工神经网络的生物学基础,人工神经网络的生物学基础,信息输入,信息传播与处理,信息传播与处理（整合）,信息传播与处理结果：兴奋与抑制,信息输出,神经网络的基本思想,人工神经元的基本构成：,人工神经元信息处理单元,人工神经元信息处理单元,信息输入,人工神经元信息处理单元,信息传播与处理：加权求和,人工神经元信

6、息处理单元,信息传播,人工神经元信息处理单元,信息传播与处理,人工神经元信息处理单元,信息输出,神经元的传递函数,f（X）是激发函数；它可以是线性函数，也可以是非线性函数例如，若取激发函数为符号函数,神经元的传递函数,S型传递函数,注：一个神经元含有与输入向量维数相同个数的权系数，若将阈值看作是一个权系数，-1是一个固定的输入，另有n-1个正常的输入，则式也可表示为： ,参数识别：假设函数形式已知，则可以从已有的输入输出数据确定出权系数及阈值。,简单原理,人工神经网络是根据人的认识过程而开发出的一种算法。假如我们现在只有一些输入和相应的输出，而对如何由输入得到输出的机理并不清楚，那么我们可以

7、把输入与输出之间的未知过程看成是一个“网络”，通过不断地给这个网络输入和相应的输出来“训练”这个网络，网络根据输入和输出不断地调节自己的各节点之间的权值来满足输入和输出。这样，当训练结束后，我们给定一个输入，网络便会根据自己已调节好的权值计算出一个输出。这就是神经网络的简单原理。,人工神经网络基本特点,（1）可处理非线性,（2）并行结构对神经网络中的每一个神经元来说；其运算都是同样的这样的结构最便于计算机并行处理,（3）具有学习和记忆能力一个神经网络可以通过训练学习判别事物；学习某一种规律或规则,（4）对数据的可容性大在神经网络中可以同时使用量化数据和质量数据（如好、中、差、及格、不及格等）,

8、（5）神经网络可以用大规模集成电路来实现如美国用 256个神经元组成的神经网络组成硬件用于识别手写体的邮政编码,人工神经网络的分类,按网络连接的拓扑结构分类：层次型结构：将神经元按功能分成若干层，如输入层、中间层（隐层）和输出层，各层顺序相连,单纯型层次型结构,人工神经网络的分类,按网络内部的信息流向分类：前馈型网络：网络信息处理的方向是从输入层到各隐层再到输出层逐层进行,前馈型网络,神经网络的学习规则,关键在于如何决定每一神经元的权值。,常用的学习规则有以下几种：,Hebb规则 Delta规则 (最小均方差规则 ) 反向传播学习方法 Kohonen学习规则(用于无指导训练网络 ) Gro

9、sberg学习方法,Hebb学习规则,1949年，D.O.Hebb基于生理学和心理学的研究，提出假设“当两个神经元都处于兴奋状态时，连接这两个神经元的权值将得到加强”。,输入样本：,当前权值：,实际输出：,权值调节公式：,权值调整量：,1904-1985,Delta规则,1986年，认知心理学家McClelland和RumeChart在神经网络训练中引入了(Delta)规则，该规则也称连续感知器学习规则。,输入样本：,当前权值：,期望输出：,基函数：,实际输出：,输出误差：,Delta规则,神经元权值调节学习规则的目的是：通过训练权值w，使得对于训练样本对（x,d），神经元的输出误差达最小

10、，误差E是权向量w的函数，欲使误差E最小，w应与误差的负梯度成正比，即其中比例系数是一个常数,误差：,误差梯度：,权值调整公式：,常用于：单层、多层神经网络、BP网。,神经网络常用模型,共70多种，具有代表性的有：（1）感知器（Perceptron）（2）多层前馈（BP）网络（3）Hopfield网络 (优化) （4）Boltzmann机（在BP中加入噪声）（5）双向联想记忆网络（快速存储） ,人工神经网络的工作原理,人工神经网络的工作原理到底是怎样的，我们可以从一个最简单的网络来剖析，一定程度上打开这个黑匣子。 1958年，美国心理学家Frank Rosenblatt提出一种具有

11、单层计算单元的神经网络，称为Perceptron，即感知器。感知器是模拟人的视觉接受环境信息，并由神经冲动进行信息传递的层次型神经网络。单层感知器的结构与功能都非常简单，以至于在解决实际问题时很少采用，但由于它在神经网络研究中具有重要意义，是研究其它网络的基础，常作为学习神经网络的起点。,人工神经网络的工作原理,感知器模型(单层前向神经网络）,j=1,2,m,人工神经网络的工作原理,感知器模型净输入：输出为： Tj为阀值，sgn为符号函数,人工神经网络的工作原理,感知器模型具体的：设输入向量X=(x1 ,x2)T 输出：则由方程w1jx1+w2jx2-Tj=0确定了二维平面上的一

12、条分界线,人工神经网络的工作原理,感知器模型具体的：则由方程w1jx1+w2jx2-Tj=0确定了二维平面上的一条分界线(Why?) w1j x1+w2j x2 Tj = 0 w1j x1 = Tj - w2j x2 x1 = (Tj -w2j x2) / w1j = - ( w2j/ w1j ) x2 +Tj / w1j = a x2 +c,人工神经网络的工作原理,感知器模型具体的：这样的话，我们就可以得到,思路：,例如；取A（1.44，2.10）和 B(1.10，1.16)，过A B两点作一条直线： y 1.47x - 0.017 其中x表示触角长；y表示翼长,分类规则：设一个蚊子

13、的数据为（x, y）如果y1.47x - 0.017，则判断蚊子属Apf类；如果y1.47x - 0.017；则判断蚊子属Af类,一、引例,作一直线将两类飞蠓分开,人工神经网络的工作原理,感知器模型一个最简单的单计算节点感知器具有分类功能。其分类原理是将分类知识存储于感知器的权向量（包含了阈值）中，由权向量确定的分类判决界面将输入模式分为两类。,单层感知器的局限性是：仅对线性可分问题具有分类能力。,感知器神经网络设计,感知器神经网络的结构,p1,p2,W1,1,W1,2,n,1,a,经典的人工神经网络算法,BP算法 BP (Error Back Propagation，BP)误差反向传播

14、算法它是有指导训练的前馈多层网络训练算法，是靠调节各层的加权，使网络学会由输入输出对组成的训练组执行优化的方法是梯度下降法 BP算法是使用非常广泛的一种算法，最常用的转移函数是Sigmoid函数,经典的人工神经网络算法,BP算法 BP 网络模型,输入层,隐含层,输出层,I,J,K,BP网络结构图,wji,wkj,经典的人工神经网络算法,BP算法学习的过程：,正向传播：输入样本输入层各隐层输出层判断是否转入反向传播阶段：若输出层的实际输出与期望的输出（教师信号）不符误差反传误差以某种形式在各层表示修正各层单元的权值网络输出的误差减少到可接受的程度进行到预先设定的学习次数为止,

15、BP算法的学习过程如下：（1）选择一组训练样例，每一个样例由输入信息和期望的输出结果两部分组成。（2）从训练样例集中取一样例，把输入信息输入到网络中。（3）分别计算经神经元处理后的各层节点的输出。（4）计算网络的实际输出和期望输出的误差。,反向传播模型及其学习算法,（5）从输出层反向计算到第一个隐层，并按照某种能使误差向减小方向发展的原则，调整网络中各神经元的连接权值。（6）对训练样例集中的每一个样例重复35的步骤，直到对整个训练样例集的误差达到要求时为止。在以上的学习过程中，第（5）步是最重要的，如何确定一种调整连接权值的原则，使误差沿着减小的方向发展，是BP学习算法必须解决的问

16、题。,反向传播模型及其学习算法,经典的人工神经网络算法,输入样本：,希望输出：,实际输出：,第J层节点的输入:,第J层节点的输出:,第K层节点的输入:,第K层节点的输出:,k=1，2，c ； c为分类的个数。,经典的人工神经网络算法,定义平方误差:,系统的均方误差:,在实际应用中，采用梯度下降法求使误差准则函数达到极小值的权系数时，使用单个样本进行误差修正，则准则函数,第J层与第K层间连接权修正公式,激励函数,经典的人工神经网络算法,第I层与第J层间连接权修正公式,又由于：,BP算法若干问题讨论,BP采用S函数，输出不宜设为1或0，可设为0.9或0.1。权系数初始化不应将初始值设为相同，否

17、则在学习过程中始终不变，可设为随机值。步长的选择应设为可变步长，以防止震荡。局部最小问题 BP算法是非线性优化算法，初始值设置不当，可能陷入局部极小。前馈网络结构输入节点数为模式维数，输出节点数一般为类别数，隐层节点数尚无明确方法，实验确定。,BP算法若干问题讨论,前馈网络结构问题,隐节点,过多过拟和，减弱泛化能力,过少欠拟和,过拟和,也有人认为一层隐层即可逼近任意函数，至于隐节点数，无理论指导，需靠实验。,BP算法若干问题讨论,前馈网络隐层节点数经验公式,网络学习技巧,重新初始化权值分类结果不满意时给权值加扰动有助于脱离局部极小如-55加10%扰动，即-0.50.5随机数在训

18、练样本中适当加入噪声提高抗噪能力学习可有允许误差加快学习速度选择合适的网络规模层数多靠近输入层传播误差不可靠节点多影响泛化能力，学习时间太长,遥感图像的BP神经网络分类,1、学习样本的获取 2、网络系统的确定 3、网络的训练 4、图像的分类 5、分类算法及结果,遥感图像的BP神经网络分类,学习样本的获取类别：森林、峡谷、河流学习样本：每个类别人工选取64个特征向量：,遥感图像的BP神经网络分类,网络系统的确定网络层数：一般取为3层输入节点：与特征个数相同，取3 隐节点数量：根据经验公式取为5 输出节点：分为3类，取3,遥感图像的BP神经网络分类,隐层节点数的计算,向上取整，保

19、证分类性能！,网络的训练,遥感图像的BP神经网络分类,BP采用S函数，输出不宜设为1或0，可设为0.9或0.1。,遥感图像的BP神经网络分类,网络的训练,注意：不应将初始值设为相同，否则在学习过程中始终不变，可设为随机值。,遥感图像的BP神经网络分类,网络的训练,遥感图像的BP神经网络分类,网络的训练,遥感图像的BP神经网络分类,网络的训练,遥感图像的BP神经网络分类,遥感图像的BP神经网络分类,图像信息,图像变换与特征提取,特征数据规格化,分类判决,图像分类结果,神经网络图像分类过程,经过训练的神经网络,遥感图像的BP神经网络分类,神经网络分类结果,数学建模中有很多题目都可以用神经网络加以

20、解决。比较典型的题目有：DNA序列分类题（2000年全国赛A题），癌症判断题（2001年北京大学数学建模竞赛），乳房癌的诊断题（2001年全国大学生数学建模夏令营C题）,神经网络在数学建模中的应用,DNA序列模式分类问题,假定已知两组人工已分类的DNA序列（20个已知类别的人工制造的序列），其中序列标号110 为A类，11-20为B类。要求我们从中提取已经分类了的DNA序列片段的特征和构造分类方法，并且还要衡量所用分类方法的好坏，从而构造或选择一种较好的分类方法。测试对象是20个未标明类别的人工序列（标号2140）和182个自然DNA序列。例如A类：,a1=aggcacggaaaaacggg

21、aataacggaggaggacttggcacggcattacacggaggacgaggtaaaggaggcttgtctacggccggaagtgaagggggatatgaccgcttgg; b1=gttagatttaacgttttttatggaatttatggaattataaatttaaaaatttatattttttaggtaagtaatccaacgtttttattactttttaaaattaaatatttatt; ,我们用前20组数据对网络进行训练，再用训练好的网络来计算未知数据，便能得到分类的结果。,文件给出了一个114个基因, 60个人的基因表达水平的样本. 其中前20个是癌症病人的基

22、因表达水平的样本(其中还可能有子类), 其后的是20个正常人的基因表达信息样本, 其余的20个是待检测的样本(未知它们是否正常). (1).试设法找出描述癌症与正常样本在基因表达水平上的区别, 建立数学模型,及识别方法,去预测待检测样本是癌症还是正常样本.,癌症判断题（2001年北京大学数学建模竞赛）,我们用前40组数据对网络进行训练，再用训练好的网络来计算后20组数据，便能得到分类的结果。,(1)采用BP神经网络方法建模的首要和前提条件是有足够多典型性好和精度高的样本。而且，为监控训练（学习）过程使之不发生“过拟合”和评价建立的网络模型的性能和泛化能力，必须将收集到的数据随机分成训练样本、检

23、验样本（10%以上）和测试样本（10%以上）3部分。 (2) 尽量获取足够多的样本，它的多少直接关系到所建模型的可靠性。,建议,(3) 建模时尽量减少隐含层神经元的个数。由于隐含层神经元个数的确定是凭经验的，而个数的多少直接关系到网络的性能。个数太少，网络容易陷入局部极小值；太多，则网络的预测结果不稳定。为此隐含层神经元个数的确定利用“试错法”来实现，即先给定一个较小的值，根据训练的结果逐渐增加，这样可找到适合该模型隐含层神经元个数的最小值，从而提高了网络的稳定性。,(4) 将神经网络与其它方法(如遗传算法)相结合。由于每种方法都有其各自的特点，多种方法的结合可改善单一方法所存在的缺陷。,BP

24、神经网络学习算法的MATLAB实现,MATLAB中BP神经网络的重要函数和基本功能,BP神经网络学习算法的MATLAB实现,MATLAB中BP神经网络的重要函数和基本功能 newff() 功能建立一个前向BP网络格式 net = newff(PR，S1 S2.SN1，TF1 TF2.TFN1，BTF，BLF，PF) 说明 net为创建的新BP神经网络；PR为网络输入取向量取值范围的矩阵；S1 S2SNl表示网络隐含层和输出层神经元的个数；TFl TF2TFN1表示网络隐含层和输出层的传输函数，默认为tansig；BTF表示网络的训练函数，默认为trainlm；BLF表示网络的权值学习函数，

25、默认为learngdm；PF表示性能数默认为mse ，误差。,BP神经网络学习算法的MATLAB实现,给定4组学习数据为输入-1 -1 2 2;0 5 0 5,理想输出-1 -1 1 1，试建立一个2层前向神经网络，第一层（隐层）由3个神经元组成且用tansig函数，第二层用purelin函数。学习规则为traingd。输入数据得PR= -1 2;0 5,隐层和输出层分别有3个和1个神经元， S1 S2= 3 1, Net=newff(PR，S1 S2，tansig,purelin，traingd) P= -1 -1 2 2;0 5 0 5, t= -1 -1 1 1 net,tr=tra

26、in(net,p,t); a=sim(net,p)输出命令,输入向量 P = 0 1 2 3 4 5 6 7 8 9 10; 期望输出 T = 0 1 2 3 4 3 2 1 2 3 4;,例：,net = newff ( 0 10, 5 1, tansig, purelin ); Y = sim(net,P); plot(P,T,P,Y,o),创建两层的BP网络,Y = -2.3431 -2.7532 -2.4510 -1.2784 -0.8590 -0.2981 0.2495 0.4811 1.0375 1.2268 1.4232 T = 0 1 2 3 4 3 2 1 2 3 4; %

27、期望输出,第一种情况的输出结果：,误差很大！未训练，非线性映射能力差。,修改程序：,P = 0 1 2 3 4 5 6 7 8 9 10; T = 0 1 2 3 4 3 2 1 2 3 4; net = newff(0 10,5 1,tansig purelin); net.trainparam.show=50; %每次循环50次 net.trainParam.epochs = 500; %最大循环500次 net.trainparam.goal=0.01; %期望目标误差最小值 net = train(net,P,T); %对网络进行反复训练 Y = sim(net,P) plot(P,

28、T,P,Y,o),Y = 0.0005 1.0026 1.9947 3.0134 3.9429 3.1211 1.8482 1.1755 1.8568 3.1150 3.9595,第二种情况的输出结果：,下表为某药品的销售情况，现构建一个如下的三层BP神经网络对药品的销售进行预测：输入层有三个结点，隐含层结点数为5，隐含层的激活函数为tansig；输出层结点数为1个，输出层的激活函数为logsig，并利用此网络对药品的销售量进行预测，预测方法采用滚动预测方式，即用前三个月的销售量来预测第四个月的销售量，如用1、2、3月的销售量为输入预测第4个月的销售量，用2、3、4月的销售量为输入预测第5个月

29、的销售量.如此反复直至满足预测精度要求为止。,%以每三个月的销售量经归一化处理后作为输入 P=0.5152 0.8173 1.0000 ; 0.8173 1.0000 0.7308; 1.0000 0.7308 0.1390; 0.7308 0.1390 0.1087; 0.1390 0.1087 0.3520; 0.1087 0.3520 0.0000; %以第四个月的销售量归一化处理后作为目标向量 T=0.7308 0.1390 0.1087 0.3520 0.0000 0.3761; %创建一个BP神经网络，每一个输入向量的取值范围为0 ,1，隐含层有5个神经元，输出层有一个神经元，隐含层的激活函数为tansig，输出层的激活函数为%logsig，训练函数为梯度下降函数， net=newff(0 1;0 1;0 1,5,1,tansig,logsig,traingd); net.trainParam.epochs=15000; net.trainParam.goal=0.01; net=train(net,P,T); Y = sim(net,P) plot(P,T,P,Y,o),可以加快网络的训练速度将每组数据都变为-1至1之间的数,BP网络应用于药品预测对比图由对比图可以看出预测效果与实际存在一定误差，此误差可以通过增加运行步数和提高预设误差精度进一步缩小,

展开阅读全文