毕业设计(论文)-光谱变换技术结合连续投影算法在模型简化中的应用.doc

上传人:椰子壳 文档编号:3947288 上传时间:2019-10-10 格式:DOC 页数:22 大小:846.50KB
返回 下载 相关 举报
毕业设计(论文)-光谱变换技术结合连续投影算法在模型简化中的应用.doc_第1页
第1页 / 共22页
毕业设计(论文)-光谱变换技术结合连续投影算法在模型简化中的应用.doc_第2页
第2页 / 共22页
毕业设计(论文)-光谱变换技术结合连续投影算法在模型简化中的应用.doc_第3页
第3页 / 共22页
毕业设计(论文)-光谱变换技术结合连续投影算法在模型简化中的应用.doc_第4页
第4页 / 共22页
毕业设计(论文)-光谱变换技术结合连续投影算法在模型简化中的应用.doc_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《毕业设计(论文)-光谱变换技术结合连续投影算法在模型简化中的应用.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)-光谱变换技术结合连续投影算法在模型简化中的应用.doc(22页珍藏版)》请在三一文库上搜索。

1、光谱变换技术结合连续投影算法在模型简化中的应用 专业:测控技术与仪器 学号:20070310110104 摘要小波变换(Wavelet Transformer,WT)技术结合连续投影算法(Successive Projection Algorithm,SPA)用于近红外光谱(Near Infrared Spectroscopy,Vis/NIR)和拉曼光谱(Raman Spectroscopy,RS)有效建模波长的选择,并采用选择后的变量建立偏最小二乘回归(Partial least squares Regression,PLSR)模型。分别采用近红外透射光谱和RS技术对葡萄酒酒精度和药片活性成

2、分含量进行定量分析。将107个葡萄酒样品的近红外光谱按照近似2:1的比例进行校正集和预测集样本的选择,因此,71个样本作为校正集,36个样本作为预测集,将WT-SPA-PLSR方法用于葡萄酒酒精度分析,结果表明,采用WT-SPA-PLSR方法后,酒精度模型的预测均方根误差(root mean square error of prediction,RMSEP)由12.594减小为12.548,预测相关系数(Correlation coefficient,R)没有变化仍为0.951,AIC值由5040.199减小为152.694,建模变量由69个变为67个;将120个药片的RS按照2:1的比例进行

3、样品集划分,80个样本作为校正集,40个样本作为预测集,将WT-SPA-PLSR方法用于药片活性成分含量分析,结果表明,采用WT-SPA-PLSR方法后,药片活性成分含量的RMSEP由7.561变为7.689,R没有变化仍为0.929,AIC值由7406.874减小为201.484,建模变量都是78个。因此,采用WT-SPA-PLSR方法不仅可以提高Vis/NIR分析模型的精度,而且可以有效简化模型;采用WT-SPA-PLSR方法虽然没有提高RS分析模型的精度,但是误差相差不大,更为重要的是,采用WT-SPA-PLSR方法可以有效简化RS分析模型。关键词:小波变换;连续投影算法;近红外光谱;拉

4、曼光谱;偏最小二乘法By using Spectrum change technology combined with Successive Projection Algorithm to simplified model Abstract Wavelet Transformer(WT) combined with Successive Projection Algorithm (SPA) were used to select effective wavelengths from Near Infrared Spectroscopy (Vis/NIR) and Raman Spectrosc

5、opy(RS).The selected effective wavelengths were as inputs of Partial least squares Regression (PLSR) model. Using Vis/NIR technique to analyze the alcohol content in wine, and using RM technique to analyze the active substance contents of pharmaceutical tables. Separate Vis/NIR of wine samples into

6、71 samples for calibration and 36 samples for prediction according to the proportion of approximate two for one. Using the method of WT-SPA-PLSR to analyze the alcohol content in wine. Results show that after adopting the method of WT-SPA-PLSR, root mean square error of prediction (RMSEP) of the mod

7、el of wine is from 12.594 reduced to 12.548, Correlation coefficient(R) remain unchanged, is still 0.951,value of AIC is from 5040.199 reduced to 152.694,variables for building model are from 69 reduced to 67.Separate RM of pharmaceutical tables into 80 samples for calibration and 40 samples for pre

8、diction according to the proportion of two for one. Using the method of WT-SPA-PLSR to analyze the active substance contents of pharmaceutical tables. Results show that after adopting the method of WT-SPA-PLSR, RMSEP of the active substance contents of pharmaceutical tables is by 7.561 into 7.689,R

9、is still 0.929,value of AIC is from 7406.874 reduced to 201.484, variables for building model remain unchanged, are still 78. So, adopt the method of WT-SPA-PLSR can not only improve the precision of the analysis model of Vis/NIR, and can effectively simplified model. However, there is no improvemen

10、t in prediction accuracy of the analysis model of RS, there is not much difference between analysis model with and without adopting the method of WT-SPA-PLSR. Most important is the method of WT-SPA-PLSR can effectively simplified model. Keyword:Wavelet Transformer; Successive Projection Algorithm; N

11、ear Infrared Spectroscopy;Raman Spectroscopy;Partial least squares Regression目录摘要- 1 -Abstract- 2 -第一章 绪论- 4 -1.1 近红外光谱介绍- 4 -1.2 拉曼光谱介绍- 4 -1.3 常用波长选择方法- 5 -1.4 常用预处理方法- 5 -第二章 材料和方法- 7 -2.1样本采集- 7 -2.1.1葡萄酒近红外光谱的采集- 7 -2.1.2药片拉曼光谱采集- 7 -2.2小波变换原理- 7 -2.3连续投影算法的实现- 8 -2.4偏最小二乘回归模型的建立- 9 -2.5 AIC信息标

12、准值- 13 -第三章 实验结果和分析- 13 -3.1近红外光谱实验数据分析- 13 -3.2近红外光谱实验结果和分析- 13 -3.2.1原始光谱建模- 13 -3.2.2应用SPA选取有效波长建模- 15 -3.2.3应用WT-SPA选取有效波长建模- 15 -3.3拉曼光谱实验数据分析- 16 -3.4药片拉曼光谱的实验结果和分析- 17 -3.4.1原始光谱建模- 17 -3.4.2应用SPA选取有效波长建模- 18 -3.4.3应用WT-SPA选取有效波长建模- 18 -第四章 结论- 20 -参考文献- 21 -第一章 绪论1.1 近红外光谱介绍 酒精度是葡萄酒的一个重要理化指标

13、,如何对其进行快速、简便、准确地测定,对葡萄酒产品的品质及其质量监控都具有重要的意义1 王豪,邬蓓蕾,林振兴,岑倩.傅里叶变换近红外光谱法快速测定葡萄酒中的酒精度J.China Brewing,2008,184:72-73.1。测定葡萄酒中酒精度的国家标准(GB/T 5009.48)需将酒样先蒸馏、定容,再用比重瓶或酒精计法测定,方法费时、费力,且测定结果只能保留一位小数,仪器分析方法(如气相色普法)分析酒中酒精度操作复杂,且仪器昂贵1。本文将采用近红外光谱(Near Infrared Spectroscopy,Vis/NIR)分析技术进行葡萄酒酒精含量测定的研究。近年来,随着计算技术的进步和

14、测试技术的提升,现代Vis/NIR分析技术以其分析速度快、效率高、成本低和易于实现在线分析等特点,在农业,医药、石化、烟草和食品等行业得到广泛应用2 高洪智,卢启鹏,丁海泉,彭忠琦.连续投影算法的土壤总氮近红外特征波长的选取J.光谱学与光谱分析,2009,29(11):2951-2954。Vis/NIR的信息来源于有机物分子的C-H、N-H、O-H等含羟基团发生的倍频以及合频对光能量的吸收,不同基团产生的光谱在吸收峰位和强度上有所不同,并随样品组成的变化其光谱在特征也发生变化,这就为Vis/NIR的定性和定量分析奠定了理论基础1。Vis/NIR谱峰较宽、信号较弱、吸收波段归属不明确且严重重叠,

15、其数据通常呈多变量、强相关性、与样品组成含量成线性关系,利用全波段进行建模分析时,光谱中的大量冗余信息及噪声等使模型的性能受到影响。针对于近红外的这些特点,在利用光谱建模前,通常需要对其预处理或波长选择,在纷繁复杂的光谱信息中提取有用的信息,提高模型校正的速度和建模的效率是本文研究的重点。1.2 拉曼光谱介绍拉曼光谱(Raman Spectroscopy,RS)又称为拉曼效应,是由其发现者印度人C.V.Raman命名的,RS是研究分子振动、转动的一种光谱方法。RS产生的原理和机制都与红外光谱不同,但它提供的结构信息却是类似的,都是关于分子内部各种简正振动频率及有关振动能级的情况,从而可以用来鉴

16、定分子中的官能团。分子偶极矩变化是红外光谱产生的原因,而RS是分子极化率变化诱导产生的,它的谱线强度取决于相应的简正振动过程中极化率的变化的大小,在分子结构分析中,RS与红外光谱是相互补充的。因此,一些在红外光谱仪无法检测的信息在RS能很好地表现出来。拉曼效应普遍存在于一切分子中,无论是气态,液态和固态,拉曼散射光谱对于样品制备没有特殊要求;对于样品数量要求比较少,可以使毫克甚至微克的数量级。拉曼散射最突出的优点是采用光子探针,对于样品是无损伤探测,尤其适合对那些稀有或珍贵的样品进行分析,甚至可以用RS检测活体中的生物物质。RS的缺点之一是会产生荧光干扰,样品一旦产生荧光,RS会被荧光所堙灭检

17、测不到样品的拉曼信号。为使检测灵敏度低3 田国辉,陈亚杰,冯清茂.拉曼光谱的发展及应用J.化学工程师,2008,148(1):34-36.。本文将利用葡萄酒Vis/NIR和药片RS作为研究对象建模,因此,在利用光谱建立校正模型前,通常需要对其预处理或波长选择,即针对特定的样品体系,通过对光谱的适当选择、处理和变换,削弱以至于消除各种非目标因素对光谱的影响,提高物系性质参数对光谱的分辨率和灵敏度4 成忠,张立庆,刘赫扬,诸爱士.连续投影算法及其在小麦近红外光谱波长选择中的应用J.光谱学与光谱分析,2010,30(4):949-9524。1.3 常用波长选择方法常用的波长选择方法,如相关系数法5

18、Min M,Lee W S.Determination of significant wavelengths and prediction of nitrogen content for citrusJ.Trans.ASAE,2005,48(2):455-461.5、载荷值法6 Wu D,He Y,Feng S.Short-wave near-infrared spectroscopy analysis of major compounds in milk powder and wavelength assignmentJ.Anal.Chim.Acta,2008,610(2):232-242.

19、6、回归系数法6等大多根据主观经验进行阈值选择,而退火算法7 Kalivas J H,Roberts N,Sutter J M.Global optimization by simulated annealing with wavelength selection for ultravioletvisible spectrophotometryJ.Anal.Chem.,1989,61(18):2024-2030.7和遗传算法8JouanRimbaud D,Massart D L,Leardi R,et al.Genetic algorithms as a tool for wavelength

20、 selection in multivariate calibrationJ.Anal.Chem.,1995,67(23):4295-4301.8的搜寻过程非常耗时,且不稳定。而连续投影算法(successive projections algorithm,SPA)是一种新的变量提取方法,利用向量的投影分析,选取含有最低冗余度和最小共线性的有效波长,对信号波长进行优选,大大减少建模所需变量的个数,提高建模的速度和效率9 吴迪,吴洪喜,蔡景波,黄振华,何勇.基于无信息变量消除法和连续投影算法的可见-近红外光谱技术白虾种分类方法研究J.红外与毫米波学报,2009,28(6);423-427.9。

21、1.4 常用预处理方法常用的波长预处理方法有Savitzky-Golay平滑(SG)、变量标准化(SNV)、多元散射校正(MSC)、一阶及二阶导数处理(1-Der and 2-Der)、去趋势处理(De-trending)、直接正交信号校正(DOSC)处理及小波变换(Wavelet Transform, WT)等。上述预处理方法中,WT是近十几年才发展并迅速应用到图像和语言分析等众多领域的数学工具,是继110多年前建立傅里叶(Joseph Fourier)分析之后的一个重大突破10 王培茂.离散余弦变换与小波变换的比较N.河北理工学院学报,2005,27(3):53-56.10。利用WT将原始

22、的光谱信号分成不同的频率组分,并对不同的频率组分进行重构,即保持了傅里叶变换的优点又满足了局部性要求,具有多分辨、方向选择性和自动调焦的特点11 高荣强,范世福,严衍禄,赵丽丽.近红外光谱的数据预处理研究J.光谱学与光谱分析,2004,24(12).1。通过WT预处理方法,可以很好的实现光谱数据平滑、降噪以及消除基线漂移。 本文将利用WT-SPA提取的有效波长作为偏最小二乘回归(Partial least squares Regression,PLSR)模型的输入,建立WT-SPA-PLSR变量分析模型,应用于葡萄酒样品的酒精度分析和药片活性成分的研究,预测其均方根误差(root mean s

23、quare error of prediction,RMSEP)和相关系数(Correlation coefficient,R),并求得AIC信息标准值12 R.A.Viscarra Rossel,T.Behrens.Using data mining to model and interpret soil diffuse reflectance spectraJ.Geoderma,2010,158:46-54.2。并将此结果与分别采用原始光谱及仅应用SPA得到的有效波长作为PLSR模型输入的结果进行比较。AIC信息标准值用于比较模型的复杂程度,AIC值越小,模型的复杂程度越低。第二章 材料和

24、方法2.1样本采集2.1.1葡萄酒近红外光谱的采集(1)仪器MPA傅立叶变化近红外光谱仪(带有RT-Pbs检测器、He、Ne激光器和石英样品杯等配件及OPUS QUANT-2定量分析软件):德国Bruker公司。(2)样品与基础数据来源收集来源于意大利、法国、澳大利亚、罗马利亚、罗马尼亚等国的107个葡萄酒样品,包括红葡萄酒、白葡萄酒、起泡葡萄酒等,根据GB/T 5009.48-2003标准对样品的基础酒精度数据进行测定,样品的酒精度为5.6%(v/v)14.5%(v/v)。(3)实验方法与光谱数据以蒸馏水为参比,将葡萄酒液体样品注入直径为2mm圆柱形品管中,在12000/cm4000/cm谱

25、区内,用动镜正反向移动双边干涉采样去扫描64次,分辨率为8/cm,采集样品的透射光谱。每个样品分别测试2次,取其平均光谱进行Vis/NIR分析。2.1.2药片拉曼光谱采集2.2小波变换原理小波变换的概念是由法国从事石油信号处理的工程师J.Morlet在1974年首先提出的,它的重要方面是图象和信号处理。小波分析方法是一种窗口大小(即窗口面积)固定但其形状可改变,时间窗和频率窗都可改变的时域局部化分析方法,即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,正是这种特性,使小波变换具有对信号的自适应性。其优于傅里叶变换的地方是,它在时域和频域同时

26、具有良好的局部化性质。小波变换基本原理如下:设(表示平方可积的实数空间,即能量有限的信号空间),其傅里叶变换为。当满足允许条件(Admissible Condition): (1) (1)时,其中为一个基本小波或母小波(Mother Wavelet)。将母函数经伸缩和平移后,就可以得到一个小波序列。对于连续的情况,小波序列为 (2) (2)其中,为伸缩因子,为平移因子。 对于离散的情况,小波序列为 (3)对于任意的函数的连续小波变换为 (4) (4)其逆变换为 (5) 小波变换就是将任意信号表示为小波的叠加,信号的小波叠加表示将信号分解为不同的尺度级。在每一尺度级,该信号又在这一尺度级对应的分

27、辨率下被分解。尺度级对应着频率,频率越高,对应的分辨率越高,换句话说,我们将信号分解成了不同的频率通道成份,并将每一频率成份又按相位进行了分解 频率越高者,相位划分越细;反之则越疏。2.3连续投影算法的实现SPA是一种新兴的波长选取方法,能够有效剔除众多波长变量之间的共线性影响,并使向量之间的共线性达到最小,降低模型的复杂度,提高建模的速度和效率,以其简便、快速的特点得到越来越多的应用,在多种样品波长选取中得到了很好的效果。其算法原理如下2:定标集的样品数M和波长数K组成一个Vis/NIR的吸收矩阵,分别记和为初始的迭代向量和需要提取的波长个数。SPA是一种前向循环选择方法,它从一个波长开始,

28、每次循环,计算它在未选入的波长上的投影,将投影向量最大的波长引入到波长组合,直到循环N次。每一次新选入的波长,都与前一个线性关系最小。SPA的步骤如下:(1) 初始化:(第一次迭代),在光谱矩阵中任选一列向量,记为(即);(2) 集合定义为:,即还没有被选择进波长链的列向量,分别计算对中向量的投影向量 (6) (6) (3) 记录最大投影的序号 (7) (4)将最大的投影作为下轮的投影向量 (8) (5),如果,回到(2)继续投影。 这样得到对波长组合,对每一对和所决定的组合分别建立定标模型,使用预测RMSEP来判断所建模型的优劣。选出最小的RMSEP,它所对应的和即为最佳的波长组合。2.4偏

29、最小二乘回归模型的建立在实际问题中,经常遇到需要研究两组多重相关变量间的相互依赖关系,并研究用一组变量(常称为自变量或预测变量)去预测另一组变量(常称为因变量或响应变量),PLSR方法是今年来发展起来的一种解决这一问题的方法。PLSR提供一种多对多线性回归建模的方法,特别当两组变量的个数很多,且都存在多重相关性,而观测数据的数量(样本量)又较少时,用PLSR建立的模型具有传统的经典回归分析等方法所没有的优点。PLSR分析在建模过程中集中了主成分分析,典型相关分析和线性回归分析方法的特点,因此在分析结果中,除了可以提供一个更为合理的回归模型外,还可以同时完成一些类似于主成分分析和典型相关分析的研

30、究内容,提供更丰富、深入的一些信息。以下介绍PLSR分析的建模方法。考虑个因变量与个自变量的建模问题。PLSR的基本做法是首先在自变量集中提出第一成分(是的线性组合,且尽可能多地提取原自变量中的变异信息);同时在因变量集中也提取第一成分,并要求与相关程度达到最大。然后建立因变量与的回归,如果回归方程已达到满意的精度,则算法中止。否则继续对第二成分的提取,直到达到满意的精度为止。若最终对自变量集提取个成分,PLSR将通过建立与的回归式,然后再表示为与原自变量的回归方程式。即PLSR方程式。为了方便起见,不妨假定个因变量与个自变量均为标准化变量。因变量组合自变量组的次标准化观测数据阵分别记为 (9

31、)PLSR分析建模的具体步骤如下:(1) 分别提取两变量组的第一对成分,并使之相关性达到最大。设从两组变量分别提出第一对成分为和,是自变量集的线性组合:,是因变量的线性组合:。为了回归分析的需要,要求:和各自尽可能多地提取所在变量组的变异信息;和的相关程度达到最大。由两组变量集的标准化观测数据阵和,可以计算第一对成分的得分向量,记为和: (10)(11)第一对成分和的协方差Cov(,)可用第一对成分的得分向量和的内积来计算。故而以上两个要求可化为数学上的条件极值问题: (12)采用Lagrange乘法,问题化为求单位向量和,使最大。问题的求解只须通过计算矩阵的特征值和特征向量,且的最大特征在为

32、,相应的单位特征向量就是所求的解,而可由计算得到 (13)(2) 建立对的回归及对的回归。假定回归模型为 (14) 其中分别是多对一的回归模型中的参数向量,和是残差阵。回归系数向量,的最小二乘估计为 (15) 称,为模型效应负荷量。(3) 用残差阵和代替和重复以上步骤。记,则残差阵,。如果残差阵中元素的绝对值近似为0,则认为用第一个成分建立的回归式精度已满足需要了,可以停止抽取成分。否则用残差阵和代替和重复以上步骤即得: ,分别为第二队成分的权数。而,为第二对成分的得分向量。 ,分别为,的第二对成分的负荷量。这时有 (16) (4)设数据阵的秩为,则存在个成分,使得 (17) 把,代入,即得个

33、因变量的PLSR方程式 (18) (5)交叉有效性检验。 一般情况下,PLS并不需要选用存在的个成分来建立回归式,而像主成分分析一样,只选用前个成分,即可得到预测能力较好的回归模型。对于建模所需提取的主成分个数,可以通过交叉有效性检验来确定。 每次舍去第个观测,用余下的个观测值按PLSR方法建模,并考虑抽取个成分后拟合的回归式,然后把舍去的第个观测点代入所拟合的回归方程式,得到在第个观测点上的预测值。对重复以上的验证,即得抽取个成分时第个因变量的预测误差平方和为(19)的预测误差平方和为 (20) 另外,再采用所有的样本点,拟合含个成分的回归方程。这时,记第个样本点的预测值为,则可以定义的误差

34、平方和为(21) 定义的误差平方和为(22) 当达到最小值时,对应的即为所求的成分个数。通常,总有大于,而则小于。因此,在提取成分时,总希望比值越小越好;一般可设定限制值为0.05,即当(23)时,增加成分有利于模型精度的提高。或者反过来说,当(24) 时,就认为增加新的成分对减少方程的预测误差无明显的改善作用。 为此,定义交叉有效性为,这样,在建模的每一步计算结束前,均进行交叉有效性检验,如果在第步有,则模型达到精度要求,可停止提取成分;若,表示第步提取的成分的边际贡献显著,应继续第步计算。2.5 AIC信息标准值 (25)为了比较得到最好的模型,采用AIC信息准则在模型的准确度和模型的简单

35、程度两者之间折中分析,来确定最好的数据处理方法。AIC信息准则算法如下:其中n是样本个数,p是预测集样本个数。AIC的值越小,模型越精简。 本文将光谱数据作为PLSR模型的输入标量,模型的因子数采用交叉验证结合F检验进行选取。采用预测均方根误差和相关系数以及AIC信息标准值对模型进行评价。- 22 -第三章 实验结果和分析3.1近红外光谱实验数据分析实验采集了葡萄酒近红外样品107个,将107个样品按照近似2:1的比例进行矫正集和预测集样本的选择,71个作为校正集,36个作为预测集。两份样本的信息如表1所示,从表中可以看出,校正集样本的范围包含了预测集样本的范围,这说明了所选择的校正集样本在参

36、与建模中具有代表性。成分 单位/% 样本数 范围 平均值 标准偏差校正集 g/g 71 5.60014.500 12.568 1.693 预测集 g/g 36 11.50013.900 12.839 0.629表1 近红外样品统计信息表3.2近红外光谱实验结果和分析3.2.1原始光谱建模将原始光谱进行预处理,然后作为PLSR模型的输入建立模型。经过预处理后选择的不同波长数的RMSE分布如图1所示,由图1可以看出,当选取9个波长时,RMSE有一个下降过程,当选取12个波长时又有一个下降过程,之后RMSE一直下降直至到选取69个波长时,RMSE趋近于零,因此确定从71个样本中选用69个波长作为PL

37、SR模型的输入变量。选择的波长如图2,其中的曲线代表原始光谱图,方框代表选择的69个波长,将69个波长带入模型中,结果如表2所示,利用原始光谱作为PLSR模型的输入变量,RMSEP为12.594,R为0.951,AIC信息标准值为5040.199。图1 原始可见Vis/NIR模型的预测均方误差随选择变量数的变化关系图2 原始光谱及选择的变量分布图表2 基于不同预处理和变量选择方法的PLSR模型的三种Vis/NIR分析结果 参数 RMSEP R AIC 变量个数 None 12.594 0.951 5040.199 69 SPA / / 157.578 / WT-SPA 12.548 0.951

38、 152.694 673.2.2应用SPA选取有效波长建模 鉴于采用原始光谱作为模型的输入变量所得的AIC信息标准值很大,模型复杂度高,采用SPA对波长进行筛选,选取含有最低冗余度和最小共线性的有效波长。将由SPA筛选得到的波长作为PLSR模型的输入变量,由此得到的结果如表2所示,AIC信息标准值为157.578。和原始光谱相比,模型的复杂度得到很大的降低。3.2.3应用WT-SPA选取有效波长建模做进一步研究,采用小波变换结合连续投影算法对光谱进行处理选择波长。对经过预处理后的光谱进行小波变换,将光谱划分不同的尺度级,再经过SPA进一步选取有效波长,所得到的不同波长数的RMSE分布如图3所示

39、。由图3可以看出,当选取4个波长时,RMSE有一个下降过程,之后RMSE一直下降直至到选取67个波长时,RMSE趋近于零,因此确定选择67个波长作为PLSR模型的输入变量,由WT-SPA得到的波长如图4,其中的曲线代表原始光谱图,方框代表选择的67个波长,将图4和图2作比较,可以看出由WT-SPA选择的波长分布更为密集。将67个波长带入模型中,结果如表2所示,利用WT-SPA得到的波长作为PLSR模型的输入变量,RMSEP为12.5477,R为0.951,AIC信息标准值为152.694。从表2中可以看出,通过WT-SPA得带的67个波长建立的模型PLSR模型的校正集分析正确率高于采用原始光谱

40、建模以及仅仅利用SPA进行有效波长的选取建立的模型,且AIC信息标准值是三种方法中最小的,说明由WT-SPA选取的波长所建模型更准确、更简单。结果表明WT-SPA对Vis/NIR进行波长有效选择后建立的WT-SPA-PLSR模型进行葡萄酒酒精度分析是可行的,并且有满意的精简度。图4 WT-SPA选择的67个波长图3 WT-SPA选择的不同变量数的RMSE分布图 3.3拉曼光谱实验数据分析实验采集了葡萄酒近红外样品120个,将120个样品按照2:1的比例进行矫正集和预测集样本的选择,80个作为校正集,40个作为预测集。两份样本的信息如表3所示,从表中可以看出,校正集样本的范围包含了预测集样本的范

41、围,这说明了所选择的校正集样本在参与建模中具有代表性。成分 单位/% 样本数 范围 平均值 标准偏差校正集 g/g 80 5.1238.464 7.422 1.094 预测集 g/g 40 5.2878.478 7.305 1.216表3 RS样品统计信息表3.4药片拉曼光谱的实验结果和分析3.4.1原始光谱建模为了验证WT-SPA不仅仅只对Vis/NIR建模有不错的简化作用,采用药片RS做进一步的研究。处理的过程如上,原始RS经过预处理后选择的不同波长数的RMSE分布如图5所示,当从80个样本中选取78个波长时,RMSE最小趋近于零,所选择的78个波长分布如图6,其中方框表示所选择的波长。将

42、这78个波长作为PLSR模型的输入变量,得到的结果如表二,RMSEP为7.561,R为0.929,AIC信息表准值为7406.874。图5 原始RS模型的预测均方误差随选择变量数的变化关系图6 原始RS选择的78个波长 参数 RMSEP R AIC 变量个数 None 7.561 0.929 7406.874 78 SPA / / 201.688 / WT-SPA 7.687 0.929 201.484 78表4 基于不同预处理和变量选择方法的PLSR模型的三种RS分析结果3.4.2应用SPA选取有效波长建模采用原始光谱作为输入变量得到的AIC值非常的大,不利于建模。现采用SPA对原始光谱进行

43、有效波长选择,将选择得到波长作为变量建立模型,最终得到的AIC值为201.688。由AIC值的变化可知,采用SPA选取有效波长可以简化模型。3.4.3应用WT-SPA选取有效波长建模进一步做深入研究,采用小波变换对原始RS进行预处理后,再利用SPA选取有效波长,此时,由WT-SPA所得到的不同波长数的RMSE分布如图7所示,由图7可以看出,当选择78个波长作为PLSR模型的输入变量时,RMSE最小。选择得到的波长如图8所示,由图8和图6比较也可以看到,由WT-SPA得到的波长分布更密集。由模型分析得到的结果见表4,RMSEP为7.687,R为0.929,AIC信息标准值为201.484。图8 WT-SPA选择的波长图7 WT-SPA选择的不同变量数的RMSE分布图从表4中可以看出,通过WT-SPA得带的78个波长建立的PLSR模型的校正集分析正确率虽然低于采用原始光谱建模以及仅仅利用SPA进行有效波长的选取建立的模型,但是相差不大,另外AIC信息标准值是三种方法中最小的,说明由WT-SPA对RS进行有效波长选择建立W

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1