基于人工神经网络的中医证候非线性建模研究.doc

上传人:李主任 文档编号:3624952 上传时间:2019-09-18 格式:DOC 页数:5 大小:422.52KB
返回 下载 相关 举报
基于人工神经网络的中医证候非线性建模研究.doc_第1页
第1页 / 共5页
基于人工神经网络的中医证候非线性建模研究.doc_第2页
第2页 / 共5页
基于人工神经网络的中医证候非线性建模研究.doc_第3页
第3页 / 共5页
基于人工神经网络的中医证候非线性建模研究.doc_第4页
第4页 / 共5页
基于人工神经网络的中医证候非线性建模研究.doc_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《基于人工神经网络的中医证候非线性建模研究.doc》由会员分享,可在线阅读,更多相关《基于人工神经网络的中医证候非线性建模研究.doc(5页珍藏版)》请在三一文库上搜索。

1、精品论文大全基于人工神经网络的中医证候非线性建模研究白云静 1,孟庆刚 1,申洪波 2,王乐 1,王连心 11 北京中医药大学,北京(100029)2 中国中医药科技开发交流中心,北京(100027)摘要:本文介绍了现有的常用证候建模方法,并详细阐述了将人工神经网络用于证候的非 线性建模的可能性,以及基于改进的 BP(back propagation)神经网络的中医证候非线性建模方法的工作过程,并以一组类风湿关节炎证候资料和一组糖尿病肾病证候资料为例分别进行分析,最终建立类风湿关节炎证候神经网络模型、糖尿病肾病证候神经网络模型,论证了以非 线性建模研究方法解决证候研究问题的可行性。关键词:BP

2、 神经网络证候非线性建模建模就是建立一个数学模型,使之能最好地拟合通过系统的输入输出数据体现出的实际 系统的动态或静态特性。证候学研究的目的就是通过对四诊信息的综合分析,找出证候的特 征,做出证型的分类诊断。因此,可以通过数理分析方法总结证型与指标之间的规律,建立 证候诊断数学模型。常用的证候建模方法分为线性建模法和非线性建模法两种。1. 线性证候建模方法及其存在的问题1.1 常用的线性证候建模方法目前常用的线性证候建模方法有多元线性回归分析、因子分析、判别分析等多元统计方 法。多元线性回归分析可以根据各指标的常数项和偏回归系数建立证候的多元线性回归方 程;因子分析可以通过将公因子表示为指标的

3、线性组合,从指标的观测值估计各个公因子的 值,从而建立证候的因子得分模型;判别分析可以对证候诊断明确的一组资料,建立证候的 判别函数。上述三种方法均可以建立证候的线性模型,并可实现对证候的诊断和预测。1.2 线性证候建模方法存在的问题多元统计方法很多都是对复杂问题的线性简化。例如:判别分析和回归分析都是不加区 别地、均衡地看待每个症状变量对线性关系的影响,同时还基于各变量的作用与其他变量的 值无关,且各变量的作用可以叠加这一不甚合理的假定而建立的症状和证候关系的一种简单 的线性描述1;因子分析也是建立每一个公因子(证候)和变量之间的线性函数。然而,中医证 候系统具有非线性复杂性特征,且症状之间

4、存在大量的多重共线性关系和协同关系,线性建 模方法虽然有利于对复杂问题的数学描述,但却很难准确地模拟症状和证候之间的复杂关 系,更难以逼近中医证候的真实面貌。2. 非线性证候建模方法非线性建模法又称黑箱建模法,即在不了解黑箱内部机理和结构的情况下,通过提取隐 含在系统的输入输出数据中的特性,建立一个能充分逼近系统实际结构的等价模型。目前人 工神经网络技术具有强大的非线性映射能力,能够任意精度逼近非线性函数,成为非线性系 统辨识的主要建模方法。中医证候的诊断过程,实质上是由收集到的各种症状,通过分析获得证型诊断的过程, 可以把这个过程看作是一个非线性映射过程,因此,我们将改进的 BP 神经网络用

5、于中医证 候的非线性建模研究,探讨了基于人工神经网络模型的非线性证候建模方法。-5-3. 基于人工神经网络的非线性证候建模方法3.1 人工神经网络简介人工神经网络(artificial neural network,简称 ANN)是在对人脑神经网络结构认识理解 的基础上,人工构造的新型信息处理系统。ANN 具有大规模的并行处理方式、良好的鲁棒 容错性、独特的信息存储方式以及强大的自学习、自组织和自适应能力,这使得它在模式识 别、控制优化、信息处理、故障诊断以及预测等方面应用广泛,其理论与技术方法在工程、 医疗卫生、农业、交通、财经、军事、环境、气象等领域显示出巨大的吸引力,并具有广阔 的应用前

6、景2。ANN 的一个显著特征是它通过自动学习来解决问题,对样本的学习过程,即为对网络中 的神经元间的联系强度(即权重系数)逐步确定的过程,通过对样本的学习,可以学会识别 自变量与应变量间的复杂的非线性关系。经过充分学习后的 ANN 获取了样本的特征规则, 并将这些规则以数字的形式分布存贮在网络的连接权中,从而构成了系统的非线性映射模 型。这样的 ANN 模型不仅能够对其学习过的样本准确识别,而且对未经学习的样本也可以准 确识别,它甚至可以充分逼近任意复杂的非线性映射关系。可见,ANN 不需要精确的数学 模型,而是通过模拟人的联想推理和抽象思维能力,来解决传统自动化技术无法解决的许多 复杂的、不

7、确定性的、非线性的自动化问题。BP 神经网络3是指基于误差反向传播算法(back propagation,简称 BP 算法)的多层前 向神经网络。BP 网络的神经元通常采用 Sigmoid 型可微函数,可以实现输入到输出间的任 意非线性映射,这使得它在函数逼近、模式识别、数据压缩等领域有着广泛的应用,也使得 它能够应用于中医证候的非线性建模。3.2 基于人工神经网络的证候非线性建模方法证候具有典型的非线性特征,证候的诊断过程,可以看作是一个从诊断指标到证候的非 线性映射过程,这个过程用非线性数学模型可以充分模拟,而 ANN 是典型的非线性数学模 型,其中的 BP 网络更具有强大的非线性拟合能力

8、。因此,我们选择用 ANN 中最常用的 BP 神经网络技术,并进行适当的改进后,建立中医证候的非线性模型,然后对建立的证候模型 的诊断性能进行测试。具体步骤如下:3.2.1 数据预处理 在建模之前,首先对试验数据进行预处理。包括对输入数据的归一化处理和对数据的主成分分析以及资料的分组处理等。先对所有数据进行归一化处理,使变换后的输入输出信息在(0,1)区间,以防止小数值 信息被大数值信息所淹没;然后对归一化处理后的数据进行主成分分析,主成分的选择标准 定为 95%。数据经过主成分分析,可对大量的输入信息进行降维处理;最后根据验证方法 进行病例分组,我们采用 3 倍交叉验证法,因此,将样本随机分

9、为 3 组。3.2.2 确定 BP 网络的结构在 MATLAB7.0 环境下,采用改进的共轭梯度学习算法(trainscg 学习算法),建立证候 的三层前向 BP 网络模型。该网络包括输入层、隐层和输出层,其中输入层包含的输入神经 元数即是证候的诊断指标数;隐层的层数及每层包含的神经元数根据具体情况而定;输出层 包含的输出神经元数即研究资料包含的基本证型数。两个隐层之间通过双曲线正切 S 型传递函数(tansig)连接,隐层与输出层之间用对数 S 型传递函数(logsig)连接。设定网络的系统误差为小于 0.01,最大迭代次数为 500 次,最小下降梯度为 1010。 其中,网络的输出节点用来

10、表示共几种证型,表示方法是一个输出节点对应一种证型。我们将包含 n 个证型的输出采用(0,1,,0)的方式,括号内共有 n 个数值,每一个数值代 表一种证型,其中 0 表示诊断不成立,1 表示诊断成立,这样可以诊断兼加证的情况。另外, 预测输出值分原始输出值和整合输出值两组,原始输出值为 0 到 1 之间的连续值;整合输出 值既可整理成(0,1)的形式(规定0.5 为 1),又可整理成 0-1 之间的分段数值,比如(0,0.2,0.4,0.6,0.8,1)等 6 个数值,这样根据数值大小即可诊断兼加证,又可判断证型的主、 次情况。3.2.3 证候网络模型的训练 先取样本的两组作为训练集,另一组

11、作为测试集,再交换其中的一组,如此循环,分别共做 3 次训练与测试,从中得出平均预测效果值。网络参数的初始值取为-0.5,+0.5上均匀分布的随机数。经重置几次网络权值的学习率和 动态训练集后,不断改善权值。到权值趋稳,即认为网络训练完成。3.2.4 证候网络模型的测试 神经网络训练的期望目标是以尽可能简单的网络结构达到尽可能高的学习精度和尽可能好的泛化能力,因此考察神经网络的性能就要看网络的泛化能力。所谓泛化,就是网络对尚未学习过的数据的正确识别能力,是否具有良好的泛化能力是网络能否投入实际使用及使 用效果如何的重要因素。它可以通过测试样本集网络诊断结果的特异性和准确率来衡量。证候网络模型的

12、权值趋稳,训练结束后,即可以采用三倍交叉验证的方法,分三次分别 对 1/3 测试样本做检验。此时只有输入矢量(即只有症状得分),无输出期望值(即没有相应证 型的判断)。经网络运算后,得出预测输出值,与期望输出进行比较,分别统计各种证型预测 值的特异性和准确率,以判断该证候神经网络模型的诊断性能。4. 实现基于人工神经网络的非线性证候建模研究我们采用上述非线性证候建模方法,在 MATLAB7.0 环境下,对一组 765 例类风湿关节 炎 (rehumatoid arthritis ,简 称 RA) 临床证候资料和一 组 449 例糖尿 病肾病( diabetic nephropathy,简称 D

13、N)临床证候资料,分别建立了 RA 证候 BP 网络模型和 DN 证候 BP 网 络模型,并均采用三倍交叉验证的方法,检验了证候神经网络模型的诊断性能(具体内容另 文详述)。测试结果显示:两种模型的平均单证特异性分别为:81.31%、81.32%;平均单证 准确率分别为:95.70%、96.25%;平均诊断准确率分别为:90.72%、92.21%。说明基于改 进的 BP 神经网络的证候模型具有较高的诊断、预测能力。5. 讨论“线性”和“非线性”是区别事物复杂性程度的标尺,在数学中,当两个变量(自变量和应 变量)的关系成正比时就称为线性关系,否则就是非线性关系4。在生命科学中,由上述概 念推广而

14、来的线性和非线性逻辑则更具实用意义,非线性逻辑表征事物各组分之间是相互作 用的,而不是相互独立的、正则的、无限可微的和平滑的4,即总体不等于部分之和,它是 复杂系统的典型特征之一。证候是机体各层级结构的整体涌现现象,中医四诊信息所表达的就是人体各层级结构的功能失调逐级涌现的结果5。显然,证候具有非线性特征。 对非线性证候系统建模应当用非线性建模法更能反映证候的实质。基于黑箱结构的人工神经网络具有强大的非线性建模能力。因此,我们将其用于证候的非线性建模。 结果显示:我们在基于共轭梯度下降算法的 BP 神经网络的基础上,对 RA 临床证候资料和糖尿病肾病临床证候资料均建立了非线性神经网络证候模型,

15、经过 3 倍交叉验证,两种证候神经网络模型均有良好的诊断预测能力。可以得出结论,人工神经网络在不必知道内部 结构的情况下能够充分模拟症状与证候的非线性映射关系。神经网络利用网络的自动学习能 力,在充分辨识证候表征信息的基础上,可以自动抽提出这些信息蕴含的内在规律,并将其 分布在网络的联接权中,从而建立了症状与证候的非线性映射函数。在这里,样本(证候)被概括为一对输入与输出的抽象的数学映射关系,各种物理表征 信息为输入单元,证型诊断为最终的输出结果。证候诊断的过程被看作了一个映射问题,通 过症状找出对应的证型诊断,神经网络把症状与证型的对应关系通过输入与输出的映射转化 成了一个非线性优化问题。虽

16、然不清楚网络模型的内部结构,但我们的研究证实这种模型却 能够充分逼近症状与证型诊断的非线性映射关系,近似真实地反映证候的全貌,这是在不打 开黑箱的前提下,建立非线性证候模型、反映证候的内在规律和特征的有效方法。BP 神经网络虽然是一个标准的非线性数学模型,但它的收敛速度非常慢,为此,我们 采用 trainscg 函数改进 train 函数,trainscg 函数是共轭梯度算法的一种变形,具有采用尺度 化共轭梯度反向传播算法对网络进行训练的功能。该算法结合了 Levenberg-Marquardt 算法 中的模型置信区间方法和共轭梯度算法,避免了耗时巨大的线搜索过程,从而大大提高了网 络的训练速

17、度。我们建立的两种证候网络最后一次训练的迭代次数分别为:58、33,说明建 立的证候网络模型有很好的收敛性能。总之,中医证候的诊断规律蕴含在足够多的样本集合中,我们的研究证实,利用神经网 络的自主学习能力从大量的样本中进行证候特征的规则提取,能够抽提出比较全面的内在规 律;同时,网络的自组织、自适应能力又能加强对边缘相似病例的辨识能力,这样的证候诊 断模型更能充分逼近证候的真实面貌。基于改进的 BP 神经网络的证候非线性数学模型具有 良好的诊断、预测能力,能够充分逼近证候的真实面貌,是证候非线性建模的可行性方法。当然,用人工神经网络建立的证候模型是否有强大的推广能力,取决于样本的含量以及 样本

18、所含信息的全面程度。因此,必须保证样本的含量足够大、样本所蕴含的证候诊断信息 足够全面,这样才能尽量真实地展示证候全貌。同时,人工神经网络的知识处理能力还需进 一步提高,还需围绕如何提高神经网络的学习能力、收敛速度、可塑性以及普化能力等方面 展开深入研究。但是目前,采用神经网络技术建立证候数学模型,从而实现对证候的非线性 建模,对中医证候的规范化研究不啻是一种可行的方法。参考文献1. 袁世宏 , 王天芳 . 多元统计 方法在建立证候诊断模 型研 究中存在问题的思考 . 北京 中医药大学学 报,2004,27(4):9-11.2.白云静,申洪波,孟庆刚,等.中医证候研究的人工神经网络方法探析.中

19、医药学刊.2004,22(12):2221-2223.3.许东,吴铮.基于 MATLAB6.X 的系统分析与设计神经网络.西安:西安电子科技大学出版社.2002 第 2版:19-24.4.包含飞.初议中医学是复杂性科学.上海中医药大学学报,2003,17(2):3-6.5. 白云静 , 申洪波 , 孟庆刚 , 等 . 中医证候复杂性特征及 证候研究思路探析 . 中国中 医药信息杂 志,2004,11(9):754-756.Nonlinear modeling in TCM symptoms based on the artificial neural networkBai Yunjing, M

20、eng Qinggang, Shen Hongbo, Wang Le, Wang LianxinBeijing University of Chinese Medicine, Beijing (100029)AbstractIn this article, the author introduces two modeling methods in analyzing TCM symptoms and thepossibility of applying artificial neural network (ANN) in TCM symptom research. Based on the w

21、orking mechanism of BP neural network, the study took two groups of rehumatoid arthritis and diabetic nephropathy cases as research subjects, and established the symptoms neural network models after the analysis. This studying method may lead to a new way of processing information of TCM symptoms.Keywords: BP Artificial Neural Network; Symptom; Nonlinear Modeling.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1