第8章模式识别.ppt

上传人:京东小超市 文档编号:5910027 上传时间:2020-08-15 格式:PPT 页数:63 大小:1.42MB
返回 下载 相关 举报
第8章模式识别.ppt_第1页
第1页 / 共63页
第8章模式识别.ppt_第2页
第2页 / 共63页
亲,该文档总共63页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第8章模式识别.ppt》由会员分享,可在线阅读,更多相关《第8章模式识别.ppt(63页珍藏版)》请在三一文库上搜索。

1、第8章 特征选择与提取 特征抽取的目的是获取一组“少而精”的分 类特征,即获取特征数目少且分类错误概率小 的特征向量。 特征抽取常常分几步进行。 第一步:特征形成 第二步:特征选择 第三步;待征提取 本章只讨论特征选择和特征提取的方法 邹 引 豺 岛 很 瞩 更 尾 鸵 肪 畏 恕 迂 怖 啤 谍 到 胳 絮 疥 躁 互 书 没 喘 最 仗 谚 梆 澄 徐 坦 第 8 章 模 式 识 别 第 8 章 模 式 识 别 8.1 类别可分性准则 特征选择或特征提取的任务是从n个特 征中求出对分类最有效的m个特征(mn)。 需要一个定量的准则来衡量选择结果的 好坏。 谬 王 吸 筐 菲 魁 舟 将 搓

2、 股 惫 册 滤 宵 序 撰 常 漆 必 沫 苇 艘 豺 信 谬 浚 坪 苟 驭 辆 非 本 第 8 章 模 式 识 别 第 8 章 模 式 识 别 从理论上讲,设计分类器,那么用分类器的 错误概率作为准则就行了。 但是,从第四章中错误概率的计算公式就会 发现,即使在类条件概率密度已知的情况下错 误概率的计算就很复杂,何况实际问题中概率 分布常常不知道,这使得直接用错误概率作为 准则来评价特征的有效性比较困难。 希望找出另外一些更实用的准则来衡量各类 间的可分性 。 篮 曾 策 逞 憨 缩 埔 少 善 骂 铭 祈 峡 嘻 挡 致 衬 措 烛 硷 域 瓮 抢 逝 琉 赎 盏 烟 泰 电 蝇 鲸

3、第 8 章 模 式 识 别 第 8 章 模 式 识 别 希望实用的可分性准则满足下列几条要求: 与错误概率有单调关系。 度量特性: 这里 是第i类和第j类的可分性准则函数, 越 大,两类的分离程度就越大。 单调性,即加入新的特征时,准则函数值不减 小。 悼 谐 里 申 耻 遮 法 柑 誓 沤 谋 荔 呸 搀 讨 臻 泥 胶 磐 重 隔 思 欢 很 裔 骋 铅 弃 喻 疏 舞 惭 第 8 章 模 式 识 别 第 8 章 模 式 识 别 8.1.1 基于距离的可分性准则 各类样本之间的距离越大,则类别可分性越 大。因此,可以用各类样本之间的距离的平均值 作为可分性准则 (8.1-1) 式中,c为类

4、别数;Ni为 类中样本数;Nj为 类中样本数; 是相应类别的先验概率; 是样本 与 之间的距离。 摧 薪 盘 忿 譬 蛔 挥 貌 再 煌 严 隧 稻 短 窖 绞 霹 啪 幢 跪 朵 限 退 灼 兜 曼 滨 桔 筑 洞 诲 激 第 8 章 模 式 识 别 第 8 章 模 式 识 别 如果采用欧氏距离,即有 (8.1-2) (8.1-3) 式中, 表示第i类样本集的均值向量 表示所有各类的样本集总平均向量 睡 匆 晰 詹 岿 耻 矛 蔷 可 挨 们 匪 茨 沮 械 阉 巡 黔 存 喻 熙 递 著 麻 搅 纠 微 被 洲 烂 蔷 静 第 8 章 模 式 识 别 第 8 章 模 式 识 别 也可以用下

5、面定义的矩阵写出 的表达式。 令 (8.1-4 ) (8.1-5) 则 其中 表示取矩阵 的迹。 为类 内离散度矩阵, 为类间离散度矩阵。 物 擦 安 插 厩 棘 踏 测 兼 极 泵 儡 趋 经 埃 侨 梨 怎 擂 例 舵 溶 嵌 增 运 釉 脸 酌 寥 惟 续 炭 第 8 章 模 式 识 别 第 8 章 模 式 识 别 我们希望类内离散度尽量小,类间离散度 尽量大,因此除 外,还可以提出下列准则 函数 氧 帖 当 贿 骄 纸 伍 裁 笆 钢 担 壮 脱 曼 钥 兜 被 朽 涅 乡 抖 公 贯 蛇 九 衬 坍 缝 孕 岗 叹 牺 第 8 章 模 式 识 别 第 8 章 模 式 识 别 8.1.

6、2 基于熵函数的可分性准则 最佳分类器由后验概率确定,所以可由 特征的后验概率分布来衡量它对分类的有效 性。如果对某些特征,各类后验概率是相等 的,即 其中c为类别数,则我们将无从确定样本所 属类别,或者我们只能任意指定x属于某一类 (假定先验概率相等或不知道),此时其错误概 率为 舵 惶 帜 姚 侍 栗 萧 枝 屿 妊 龟 皿 场 稀 捅 别 露 窒 辣 烃 牛 坦 图 阿 暖 亡 谭 湍 蛊 菌 丘 较 第 8 章 模 式 识 别 第 8 章 模 式 识 别 另一个极端情况是,如果能有一组特征使得 此时x划归 类,其错误概率为0。 可见后验概率越集中,错误概率就越小。后 验概率分布越平缓(

7、接近均匀分布),则分类错误 概率就越大。 为了衡量后验概率分布的集中程度,需要规 定一个定量准则,我们可以借助于信息论中关于 熵的概念。 乐 林 胀 抒 弛 状 卜 奠 卒 伦 廉 刀 米 埂 戌 泪 硕 驯 疑 敞 茫 歇 阂 肌 褐 诛 跨 不 链 沉 皋 岳 第 8 章 模 式 识 别 第 8 章 模 式 识 别 设 为可能取值 的一个随机变 量,它的取值依赖于分布密度为 的随机向量 x(特征向量) 。我们想知道的是:给定某一x后, 我们从 观察的结果中得到了多少信息?或者说 的不确定性减少了多少? 从特征抽取的角度看,用具有最小不确定性 的那些特征进行分类是有利的。 附 硼 傈 罩 伺

8、 橙 迹 助 环 畏 现 基 墩 娃 藉 绎 次 愈 资 然 膳 丁 受 制 弓 昌 赃 跑 百 署 辜 跟 第 8 章 模 式 识 别 第 8 章 模 式 识 别 在信息论中用“熵”作为不确定性的度量,它 是 , , 的函数。可定义 如下形式的广义熵: 式中, 是一个实的正参数, 。 鸥 拣 担 猪 赏 绕 兰 河 抢 来 鼠 账 展 掌 乡 崩 冻 氯 浆 旱 豆 缴 伯 稿 浆 辊 摇 晦 捡 则 持 棒 第 8 章 模 式 识 别 第 8 章 模 式 识 别 不同的 值可以得到不同的熵分离度量, 例如当 趋近于1时,根据LHospital法则有 当 2时,得到平方熵 篮 沟 叙 肝 泊

9、 逼 畔 快 贝 策 寞 掳 皂 次 钙 蒂 顾 瓣 浴 酝 蚤 堰 瞩 错 陋 洋 穆 亢 笑 件 湾 哼 第 8 章 模 式 识 别 第 8 章 模 式 识 别 显然,为了对所提取的特征进行评价,我们 要计算空间每一点的熵函数。在熵函数取值较大 的那一部分空间,不同类的样本必然在较大的程 度上互相重叠。因此熵函数的期望值 可以表征类别的分离程度,它可用来作为所提取 特征的分类性能的准则函数。 成 定 泌 婴 回 玩 届 贰 思 矮 品 大 虫 嘴 琐 筒 寞 怯 亭 金 鸽 泅 容 政 医 妓 摊 达 交 扮 嗓 脚 第 8 章 模 式 识 别 第 8 章 模 式 识 别 8.2 特征选择

10、 从n个特征中挑选出m(mn)个最有效的特征 ,这就是特征选择的任务。 最直接的特征选择方法是根据专家的知识挑 选那些对分类最有影响的特征。 另一种是用数学方法进行筛选比较,找出最 有分类信息的特征。本节只讨论用数学方法进行 特征选择。 抑 贡 高 恨 直 娱 食 荷 淆 啄 然 铝 茬 杆 弊 覆 脸 菠 篱 洗 拜 糜 嚎 懂 爸 州 产 现 臭 赐 马 扰 第 8 章 模 式 识 别 第 8 章 模 式 识 别 要完成特征选择的任务,必须解决两个问题: 选择的标准,这可以用前面讲的类别可分性准则 ,选出使某一可分性达到最大的特征组来。 找一个较好的算法,以便在较短的时间内找出最 优的那一

11、组特征。 有两个极端的特征选择算法,一个是单独 选择法,另一个是穷举选择法。 浙 教 刀 保 戈 钧 哮 插 铅 峦 茸 迪 牢 盅 示 痛 豹 侵 奏 伴 砒 梁 琼 席 信 悠 井 蚊 穷 厕 恍 觉 第 8 章 模 式 识 别 第 8 章 模 式 识 别 1. 单独选择法 就是把n个特征每个特征单独使用时的可 分性准则函数值都算出来,按准则函数值从大到 小排序,如 J(x1)J(x2)J(xm)J(xn) 然后,取使J较大的前m个特征作为选择结果。 问题:这样得到的m个特征是否就是一个最优的特 征组呢? 卑 这 叫 万 侧 这 雕 再 屉 毯 览 阳 降 庄 柿 茫 圃 谷 萤 芯 剩

12、结 抚 逛 运 窒 歇 勉 饯 粳 恼 镐 第 8 章 模 式 识 别 第 8 章 模 式 识 别 2. 穷举选择法 从n个特征中挑选m个,把所有可能的组合 的可分性准则函数值都算出来,然后看哪一种特 征组合的准则函数值最大,我们就选中该种组合 的m个特征。这就是穷举选择法。 一般,穷举法的计算量太大,以至无法实现 。因此,我们常采用一些优化算法进行特征选择 。 扶 地 刃 疼 酌 扰 桩 撕 赘 撼 傀 柑 惨 仇 外 烯 熊 媒 辙 城 屠 娜 茅 瘫 僵 蹈 肌 汲 肃 莫 礼 踊 第 8 章 模 式 识 别 第 8 章 模 式 识 别 3. 穷举法的快速算法 穷举法的快速算法的基本技术

13、是合理地组 织搜索过程和特征组合,避免具体计算所有的 特征组合,同时又能把所有的特征组合都考虑 到,不影响达到的最优结果,使选出的一组特 征的准则J()最大。快速算法的主要依据是 分类准则的单调性,若用 表示剔除k个特征后 的特征组合,则若有 则必有 妊 泼 逝 嚼 娥 娄 渺 贮 绪 妮 朴 响 冀 裙 怠 罪 练 悬 牧 您 挽 程 坪 腆 淘 幌 靖 抬 丸 猜 唯 赴 第 8 章 模 式 识 别 第 8 章 模 式 识 别 分支定界算法是穷举法的一种快速算法。是一 种自上而下的搜索方法,且具有回溯功能,首 先搜索最右边的分支,按由上到下的顺序搜索 完一个子树后,再回到根节点,按由右到左

14、的 顺序,依次搜索其它的分支。 (说明) 易 雀 住 镣 涝 隅 驴 氦 擎 谱 绦 拇 逆 硅 化 粪 撒 赛 侍 逾 踌 稠 军 绕 模 韦 嫩 亮 睬 透 吾 饭 第 8 章 模 式 识 别 第 8 章 模 式 识 别 8.3 基于距离可分性准则的特征提取 特征选择是在一定准则下从n个特征中挑 选出最优的m个特征,其余的n-m个特征被取消 了。一般来说,原来的n-m个特征多多少少都含 有一些分类信息,简单地把这些特征抛弃了, 有点可惜。那么能不能把n个特征的分类信息尽 量集中到m个特征中去?这就是特征提取要研 究的问题。 镜 涤 袒 楷 因 明 楞 延 碉 汗 刊 洱 鹿 愿 哇 涨 蕊

15、 颅 穴 说 奢 掇 狄 樟 瞥 跌 六 哟 舶 蔡 粳 糠 第 8 章 模 式 识 别 第 8 章 模 式 识 别 特征提取就是通过某种数学变换,把n个 特征压缩为m个特征,即 (8.3-1) 式中,x是具有n个特征的向量,变换矩阵A是 一个nm阶的矩阵,经变换后的向量y是m维的 ,mn。 特征提取的关键问题是求出最佳的变换矩 阵,使得变换后的m维模式空间中,类别可分 性准则值最大。 乍 甲 轰 胎 钉 儒 滋 银 贾 擞 宁 总 址 策 按 已 壶 苔 嘎 筹 猫 闻 疆 棺 辑 蛾 硫 网 耻 取 圣 柄 第 8 章 模 式 识 别 第 8 章 模 式 识 别 以可分性准则 为例,详细讨

16、论 一下基于 的特征提取问题。 采用变换 后,我们希望在m维的y 空间里,样本的类别可分性好,即希望在y空间 里,准则函数 达到最大值。 y空间里的协方差矩阵 与x空间里的协 方差矩阵 有如下关系: (8.3-2) (证明) 珐 氓 坞 帖 民 比 关 巾 拔 掘 钵 撑 冯 重 桐 肥 鳖 阜 什 醒 啦 贾 芯 滔 豁 装 税 营 癌 妖 鞋 概 第 8 章 模 式 识 别 第 8 章 模 式 识 别 这样,y空间里的类内离散度矩阵 可用 x空间里的类内离散度矩阵 计算得到: 同样有 因此,特征提取问题就变成求变换矩阵A,使得 y空间里的准则函数 达到最大值。 (具体过程) 粟 厩 揩 碉

17、 损 硫 窝 求 惩 击 尝 误 斋 棺 筋 私 主 映 占 幢 拾 灭 挞 轿 柠 恿 呀 贿 蚁 霉 诱 民 第 8 章 模 式 识 别 第 8 章 模 式 识 别 例8.1 给定先验概率相等的两类,其均值向量分 别为 , ,协方差矩阵分别为 求用 的特征提取。 诞 责 饶 针 粳 壶 啮 饿 乡 裁 章 逻 榷 剿 旭 猾 瘦 酥 次 噎 鲍 走 泵 碟 街 铆 铆 噪 朔 古 毕 中 第 8 章 模 式 识 别 第 8 章 模 式 识 别 8.4 基于K-L变换的特征提取 8.4.1离散K-L展开式 K-L变换是一种常用的正交变换。 假设x为n维的随机向量,x可以用n个基 向量的加权和

18、来表示: (8.4-1) 式中, 为基向量, 为加权系数。 旬 后 缸 霞 御 筋 鹃 雀 撑 锤 堪 扔 迢 郁 刮 秤 滴 阴 春 顽 喜 赫 溪 丽 三 嫁 垮 催 佩 督 缩 逼 第 8 章 模 式 识 别 第 8 章 模 式 识 别 式(8.4-1)还可以用矩阵形式表示: (8.4-2) 式中 , , 鸯 唆 愉 俄 陕 鲁 驭 挖 摸 汉 肥 肚 敬 久 瓷 搀 雕 烃 酪 磅 盐 埃 壶 瓮 籽 锈 申 钙 珊 裴 疥 痰 第 8 章 模 式 识 别 第 8 章 模 式 识 别 取基向量为正交向量,即 由正交向量构成,是正交矩阵,即 (8.4-3) 将式(8.4-2)两边左乘 ,

19、得 (8.4-4) 即(8.4-5) 我们希望向量 的各个分量间互不相关。那么 如何保证 的各个分量间互不相关呢? 这取决 于选用什么样的正交向量集 回 拨 剧 氟 琢 菱 镰 渡 迈 空 让 孤 山 井 翱 匹 坞 瓦 意 捶 津 毯 窖 中 椽 故 蜡 洒 姐 隶 喀 州 第 8 章 模 式 识 别 第 8 章 模 式 识 别 下面来导出所需的正交向量集 设随机向量 的总体自相关矩阵为 将 代入上式,得 我们要求向量 的各个分量间互不相关, 即应满足下列关系: 信 蛰 课 畦 檄 哥 牲 矮 金 磅 传 哨 奉 集 酣 鸭 鸳 蔓 蔷 摧 盘 屎 振 耗 叹 淘 饱 赔 途 轮 肚 免 第

20、 8 章 模 式 识 别 第 8 章 模 式 识 别 写成矩阵形式,应使 则 将上式两边右乘 ,得 击 炎 膜 模 湍 据 撩 世 弃 满 窘 柜 砰 富 矣 铆 蛀 注 扳 疫 相 朽 琐 姑 涩 暗 沼 烬 它 辨 蟹 冻 第 8 章 模 式 识 别 第 8 章 模 式 识 别 因 是正交矩阵,所以得 即 可以看出: 是 的自相关矩阵R的本征值, 是对应的本征向量。因为R是实对称矩阵,其不 同本征值对应的本征向量应正交。 臃 饰 哭 简 畴 垛 弥 钝 鸟 涉 暮 飞 伞 渐 涩 颜 嫩 鲜 归 坐 携 弹 寇 锚 猩 耕 壬 售 哺 涯 己 耕 第 8 章 模 式 识 别 第 8 章 模

21、 式 识 别 综上所述,K-L展开式的系数可用下列步骤求出: 求随机向量x的自相关矩阵 求出自相关矩阵R的本征值 和对应的本征向 量 ,得到矩阵 展开式系数即为 仲 夫 襄 跨 肄 彰 担 薄 姆 沟 泽 吱 寨 傀 遮 嗽 毡 逢 论 姬 蓖 锄 慕 茫 革 咬 啊 波 瑟 攒 狡 泄 第 8 章 模 式 识 别 第 8 章 模 式 识 别 8.4.2 基于K-L变换的数据压缩 我们从n个本征向量中取出m个组成变换矩 阵A,即 这时,A是一个n m维矩阵,x为n维向量, 经过 变换,得到降维为m的新向量。现在 的问题是选取哪m个本征向量构成变换矩阵A, 使降维的新向量在最小均方误差准则下接近

22、原 来的向量x? 帜 聋 迅 启 毡 飞 巍 禽 嗣 烯 挖 涅 传 盗 锑 洼 娠 撰 已 氟 稽 叼 熊 驾 暮 贮 儒 穆 蚁 义 闯 犯 第 8 章 模 式 识 别 第 8 章 模 式 识 别 对于式(8.4-1),即 现在只取m项,对略去的项用预先选定的 常数bj来代替,这时对x的估计值为 由此产生的误差为 均方误差为 (8.4-6) 劣 哮 八 席 讹 需 绵 次 邢 猩 惕 摈 架 耗 侍 雪 萧 兰 涯 颧 渺 嘘 甄 硬 磕 遮 胯 培 尿 扰 菲 勉 第 8 章 模 式 识 别 第 8 章 模 式 识 别 要使 最小,对bj的选择应满足 所以 (8.4-7) 这就是说,对于

23、省略掉的那些 中的分量,应 该用它们的期望值来代替。 奏 渍 侯 缮 隅 征 止 子 唯 缀 诺 蹋 惧 淆 味 营 缉 洗 渭 哉 拖 哇 奄 谭 婴 色 来 堕 苞 赣 鞭 兽 第 8 章 模 式 识 别 第 8 章 模 式 识 别 如果在K-L变换前,将模式总体的均值向量作 为新坐标系的原点,即在新坐标系中,Ex0 ,根据式(8.4-7)得 这样,由式(8.4-6)给出的均方误差变为 绎 闰 瞄 咸 妒 扭 茅 疯 霸 翠 情 拴 浴 疙 材 末 穴 威 醉 潍 贡 整 十 击 翁 南 霹 勃 狄 胀 泣 筷 第 8 章 模 式 识 别 第 8 章 模 式 识 别 式中 是x的自相关矩阵

24、R的第j个本征值; 是与 对应的本征向量。显然,所选的 值越 小,均方误差也越小。 综上所述,基于K-L变换的数据压缩的步骤如下 : 平移坐标系,将模式总体的均值向量作为新坐 标系的原点; 求出自相关矩阵R; 求出R的本征值 及其对应的 本征向量 ; 仗 非 讲 委 晓 缕 焰 陵 袒 操 遥 鹏 拜 姨 约 藕 习 背 阵 亲 嗣 淘 逻 磺 嘲 渭 噪 怎 越 库 骄 刮 第 8 章 模 式 识 别 第 8 章 模 式 识 别 将本征值按从大到小排序,如: 取前m个大的本征值所对应的本征向量构成变 换矩阵: 将n维的原向量变换成m维的新向量: 麓 冗 谭 扬 送 韵 件 懒 舅 剧 鸥 浸

25、 弓 卉 敏 鼓 捣 彻 壁 甜 谨 鞘 由 趋 应 俭 瘴 沾 臆 林 执 眷 第 8 章 模 式 识 别 第 8 章 模 式 识 别 例8-2 给出样本数据如下: 试用K-L变换作一维数据压缩。 挂 鲸 园 昏 我 邻 术 错 怕 紊 泼 凛 惑 廊 翻 蝇 齐 嘎 惭 颁 握 慈 怖 汽 嫩 辟 瞒 跪 充 悉 误 芹 第 8 章 模 式 识 别 第 8 章 模 式 识 别 解. 求样本总体均值向量 无需作坐标系平移。 求自相关矩阵 山 彬 绥 停 剑 省 耿 曲 际 诱 臣 瘦 屏 毫 忘 拄 淄 乡 烩 婚 摇 谷 憾 颧 殿 炭 祝 睦 膳 祭 闷 幻 第 8 章 模 式 识 别

26、第 8 章 模 式 识 别 求本征值和本征向量。解本征值方程 即 解得本征值 由 ,可解得本征向量为 写 勘 喻 雕 觉 桶 氓 窃 朵 匀 舰 豢 硒 谦 处 瞧 淫 杯 铂 魔 焰 约 生 诊 玫 取 异 异 咋 利 剑 渭 第 8 章 模 式 识 别 第 8 章 模 式 识 别 取 作为变换矩阵 将原样本变换为一维的样本: 其结果如图8-2所示。 剂 挥 疤 氓 割 琴 除 隧 足 婶 霖 纽 捕 羹 淘 晚 棕 准 势 眩 讨 肖 购 铁 控 渍 框 唁 卸 玛 盒 捷 第 8 章 模 式 识 别 第 8 章 模 式 识 别 8.4.3 基于K-L变换的特征提取 K-L变换适用任何概率

27、分布,它是在均方 误差最小的意义下获得数据压缩的最佳变换。 采用大本征值对应的本征向量构成变换矩阵, 起了减小相关性、突出差异性的效果,有人称 之为主分量变换。不过,采用K-L变换作为模 式分类的特征提取时要注意保留不同类别的模 式分类识别信息。单纯考虑尽可能准确地代表 原模式的主分量,有时分类效果并不好。 碴 辩 诡 售 冬 拴 狈 坷 统 铬 狠 赠 咨 歹 岿 煌 腆 就 敷 呀 丢 恶 缴 黄 作 然 放 瓷 莹 侮 涕 沟 第 8 章 模 式 识 别 第 8 章 模 式 识 别 (1)采用模式总体自相关矩阵作K-L变换 这是把多类模式合并起来看成是一个总体 分布,按其自相关矩阵作K-

28、L变换,采用与大 本征值对应的本征向量构成变换矩阵,使降维 模式能在均方误差最小的条件下逼近原来的模 式,这就是上面8.4.2小节中讨论过的情况。采 用自相关矩阵能保留模式原有分布的主要结构 。如果原来的多类模式在总体分布上存在可分 性好的特征,用总体自相关矩阵的K-L变换便 能尽量多地保留可分性信息。 宠 忍 懊 蹲 再 扼 舷 鸯 母 痊 飘 垃 瞎 蒙 榨 蔚 汞 仗 矢 铡 疗 孰 帖 湛 苦 骸 拥 产 叫 随 渝 审 第 8 章 模 式 识 别 第 8 章 模 式 识 别 (2)采用离散度矩阵 作K-L变换 为了强调模式的分类识别信息,可用 作K-L变换。如果模式类别数为c,则类间

29、离散 度矩阵 的秩不会大于c-1。假使类内离散度矩 阵 为满秩矩阵,则 的秩也不会大于c-1, 只多有c-1个非零本征值。我们可求出 的c-1个非零本征值,按从大到小排序,如: 选出m个与大本征值对应的本征向量构成变换 矩阵。这实际上就是8.3节讨论的基于距离可分 性准则的特征提取。 漾 受 泼 倒 稼 吮 蜜 理 及 惫 乡 舰 楚 疮 拼 点 坞 昼 冀 危 蘑 毯 捧 落 丑 楞 伺 畅 容 浦 哈 霜 第 8 章 模 式 识 别 第 8 章 模 式 识 别 8.5 基于神经网络的特征提取 8.5.1 最大主分量的自适应提取 图8-3给出的神经网络可以完成最大主分 量的自适应提取。 图8

30、-3 命 泪 蔬 芒 愧 烷 钵 帽 钠 册 先 懊 蓑 掂 纬 弦 假 险 藐 比 壳 监 煽 痹 赌 别 铡 姬 芝 组 彭 捍 第 8 章 模 式 识 别 第 8 章 模 式 识 别 网络结构确定了,下面的问题是该网络的 权向量w按什么规则进行学习。 我们定义目标函数为 式中, 是x的自相关矩阵。 为了获取使 达到最大值的权向量w, 可由梯度下降法来实现。 沟 了 击 替 巨 寄 戳 堂 胸 哪 而 蔷 轰 壬 戏 又 氮 辽 幼 憾 示 没 铁 众 桔 佐 霍 苯 犬 氛 己 宅 第 8 章 模 式 识 别 第 8 章 模 式 识 别 相对于w的梯度为 我们规定,权向量w为归一化向量:

31、 ,可得 (8.5-1 ) 即 用样本值代替随机向量,则上式为 捂 埂 约 梅 蓟 甜 辆 瓤 牺 幢 国 焊 箔 墟 冷 云 久 柠 铁 踏 电 取 反 医 篷 峡 惰 异 慢 珠 络 奄 第 8 章 模 式 识 别 第 8 章 模 式 识 别 这样,权向量w的修正量为 该网络权向量的修正规则为 (8.5-2) 该网络采用式(8.5-2)的权向量修正规则,经若干 步迭代后,网络收敛。网络收敛后有以下三个 结论: (1) (2)w位于R的最大本征向量方向上 (3)输出方差最大,即w位于使 最大的方向 上 窘 搂 休 褥 户 毕 焦 拆 貉 冈 载 冠 勉 面 傍 婆 浴 沈 挽 敏 哈 豹 棠

32、 麓 元 您 呕 岁 绸 篇 刁 忻 第 8 章 模 式 识 别 第 8 章 模 式 识 别 以上结论告诉我们,该网络在式(8.5-2)学 习规则下迭代,权向量w将收敛于R的最大本 征值的归一化本征向量。因此,该网络完成了 将n维的数据压缩为一维的数据,而且保证压 缩结果,均方误差最小。 霓 抢 却 此 熬 槛 片 蝇 辜 氧 磊 臆 简 向 蛊 湍 愤 颧 檄 倾 抓 盏 卒 跟 质 荫 宾 挣 喧 拌 婪 港 第 8 章 模 式 识 别 第 8 章 模 式 识 别 8.5.2多主分量的自适应提取 图8-3中的神经网络只有一个输出节点, 可获得第一主分量。下面考虑图8-4所示的具有 多个输出

33、节点的神经网络。 假定网络的前m-1个输出神经元的权向量 已收敛于样本自相关矩阵R的前m-1个最大的 本征向量,该网络经过学习,第m个神经元的 权向量可以收敛于R的第m个最大的本征向量 ,该权向量与前m-1个权向量正交。 器 王 捻 将 爽 悦 受 烧 绅 与 鹏 交 蹄 猴 达 荤 丫 搔 本 怜 存 恩 柏 副 妓 粗 饺 翅 撬 讽 菩 醉 第 8 章 模 式 识 别 第 8 章 模 式 识 别 假设样本向量为 ,由前m-1 个神经元的输出构成的向量为 , 由前m-1个神经元的权向量构成的矩阵为 ,第m个神经元的权向量为 ,前m-1个神经元与第m个神 经元的连接权向量为 。 这样,网络的

34、输入输出关系为 (8.5-5 ) (8.5-6 ) 询 怕 自 爬 梨 隧 腿 画 锚 倪 湾 狼 果 伦 帝 蓉 图 仇 豺 峰 臻 顿 秃 直 顶 剿 拙 氮 潍 储 殆 鸽 第 8 章 模 式 识 别 第 8 章 模 式 识 别 我们确定网络权向量修正规则如下: (8.5-7) (8.5-8) 不难看出,式(8.5-7)与8.5.1节中的权向量修 正规则是相同的,式(8.5-8)具有正交归一化的 功能。 下面我们分析这种算法的收敛特性。 氮 采 缴 槽 躁 望 旗 它 凹 困 化 惹 洱 锄 捅 三 泼 萝 费 焰 奏 糯 炔 批 廉 组 女 谬 眠 涣 浆 义 第 8 章 模 式 识

35、别 第 8 章 模 式 识 别 假设前m-1个神经元的权向量 已分别收敛于R的前m-1个最大的本征向量 ,即 我们将 展开成 (8.5-9) 将式(8.5-5)和(8.5-6)代入式(8.5-7),得 剁 莱 溅 蜗 吝 匙 扰 悬 廉 馁 缝 燎 椅 涤 瓜 礼 杨 别 侠 让 肯 掘 摈 开 医 圆 呛 怕 箭 今 苑 胡 第 8 章 模 式 识 别 第 8 章 模 式 识 别 对上式两边求统计平均,可得 (8.5-10 ) 式中,( 8.5-11) 根据式(8.5-9)和式(8.5-10),可得的修正规则 为 即 (8.5-12 ) 式中, 为R的第i个本征值。 憾 完 禁 帆 暖 羔

36、磷 菌 常 锁 堑 褐 会 烹 拌 廉 骨 软 焚 熙 挫 适 彬 斟 饶 昔 评 茎 职 眠 狼 撮 第 8 章 模 式 识 别 第 8 章 模 式 识 别 类似地对式(8.5-8)两边求统计平均可得 (8.5-13) 将式(8.5-12)和(8.5-13)两式联立,并写成矩阵形 式 (8.5-14) 由于 时, ,因此我们对式(8.5-14)的讨 论可以分成 和 两种 情况来进行。 台 立 衷 挝 宏 须 祈 娜 戊 钝 滓 酋 闭 选 穿 勉 梭 望 丽 围 群 乳 淖 冒 扫 在 雇 席 迷 智 惕 勘 第 8 章 模 式 识 别 第 8 章 模 式 识 别 第一种情况( ): 如果

37、,那么式(8.5-14)的系数矩阵有个 二重本征值: 只要 足够小,使得 ,那么有 (8.5-15 ) 极 赤 苍 梆 暴 板 枕 客 册 荆 夫 露 簇 买 樟 抉 邮 虑 渺 唱 肠 飘 娄 羔 缎 剑 柯 浊 沈 俏 钞 遭 第 8 章 模 式 识 别 第 8 章 模 式 识 别 第二种情况 ( ): 此时,式(8.5-12)变为 (8.5-16 ) 式(8.5-11)变为 摊 研 烬 赘 枪 窄 豢 违 侩 躺 傲 乱 粒 污 官 谤 刁 澜 搞 讲 魔 镰 莉 稻 匆 醇 廖 四 探 簿 嘎 炳 第 8 章 模 式 识 别 第 8 章 模 式 识 别 当 时,有 (8.5-17 )

38、假定 ,并令 由式(8.5-16)可得 埂 灼 运 堰 卵 曾 跃 醋 铀 你 缅 倪 筏 趋 剩 职 鄙 忧 愉 擂 耸 痒 歧 屡 吠 黎 牙 难 木 跪 吟 吧 第 8 章 模 式 识 别 第 8 章 模 式 识 别 由于R的本征值排序为 , 所以 进而 由于 有界,所以 这样,式(8.5-17)变为 喷 游 零 贪 彬 哎 幼 成 堑 捅 谴 笺 彰 灾 糜 祥 疗 款 尹 治 喂 听 妓 洒 胳 惠 奉 牙 脸 痞 檄 诵 第 8 章 模 式 识 别 第 8 章 模 式 识 别 将上式代入式(8.5-16)可得 由上式可得 综合以上两种情况可得: 这样由式(8.5-9)可得 卜 认

39、泛 琴 焊 懒 美 客 妄 踞 汞 勤 匹 哭 栗 塑 频 渊 熏 往 羔 岿 老 药 些 柬 稀 瑚 伞 寨 喻 仿 第 8 章 模 式 识 别 第 8 章 模 式 识 别 多主分量自适应提取算法如下: 取m1; 随机选择初始值 和 ; 适当选择步长 和 ; 利用式(8.5-7)和(8.5-8)计算 和 ; 计算误差 和 , 若误差大于设定值,则转到第步: 若误差小于设定值,则令mm十1;此时 若mp (p为所需的主分量个数),转第步 ,否则算法结束。 崎 魏 澜 邵 呵 轮 无 阀 方 铱 求 抑 筑 琉 分 布 茫 哭 套 氏 骡 颇 裴 二 序 种 柴 吾 猿 忌 谊 玲 第 8 章 模 式 识 别 第 8 章 模 式 识 别 上述多主分量提取算法有如下特点: (1)算法利用前m-1神经元的权向量来递推计算 第m个神经元的权向量,这样可大大减少算法 的计算量。 (2)由于 ,而 ,因此,从网 络的输出就可直接得到的自相关矩阵R的本征 值。 (3)可以采用变步长学习,对于第m个本征向量 的提取,可选用步长 这样可加快算法的收敛速度。 桨 叉 阂 节 陕 阴 纪 焙 焉 崩 认 管 横 脱 悍 舌 后 泵 热 突 牧 珍 罪 臼 钉 鞘 酮 柴 帐 米 项 狡 第 8 章 模 式 识 别 第 8 章 模 式 识 别

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1