小儿常见发热出疹性疾病智能诊断模型研究.doc

上传人:scccc 文档编号:12713940 上传时间:2021-12-05 格式:DOC 页数:5 大小:219KB
返回 下载 相关 举报
小儿常见发热出疹性疾病智能诊断模型研究.doc_第1页
第1页 / 共5页
小儿常见发热出疹性疾病智能诊断模型研究.doc_第2页
第2页 / 共5页
小儿常见发热出疹性疾病智能诊断模型研究.doc_第3页
第3页 / 共5页
小儿常见发热出疹性疾病智能诊断模型研究.doc_第4页
第4页 / 共5页
小儿常见发热出疹性疾病智能诊断模型研究.doc_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《小儿常见发热出疹性疾病智能诊断模型研究.doc》由会员分享,可在线阅读,更多相关《小儿常见发热出疹性疾病智能诊断模型研究.doc(5页珍藏版)》请在三一文库上搜索。

1、小儿常见发热出疹性疾病智能诊断模型研究王庆华,唐 甜,王清青,刘雅琼,林 辉,黄国荣,熊鸿燕 (400038 重庆,第三军医大学军队流行病学教研室)提要 目的 探索实用于社区医生和家庭成员使用的小儿常见发热出疹性疾病智能诊断方法。方法 收集2005年1月至2010年11月第三军医大学西南医院儿科及感染科248例小儿发热出疹性疾病住院患者的临床资料,其中男性133例,女性115例,平均年龄4.56岁。病种包括麻疹、幼儿急疹、水痘、手足口病、猩红热、风疹和药疹等。整理并描述发热、皮疹、主要伴随症状、血常规及流行病学相关数据特征,进行主成分分析(PCA);以反向传播神经网络(BPNN)为技术平台,构

2、建智能诊断模型,进一步通过前瞻和回顾数据验证模型的准确性。结果 经PCA 处理后,31个临床及流行病学特征指标被综合成13个主因子;BPNN模型的输入、隐层和输出神经元分别为13、9、7;模型对小儿发热出疹性疾病回顾性诊断平均准确率达到99.53%,预测诊断平均准确率达到92.86%。结论 以临床样本为依据建立的BPNN诊断模型可准确诊断常见小儿发热出疹性疾病,有明显的应用前景。关键词 误差反传神经网络;发热出疹性疾病;主成分分析;智能诊断模型中图法分类号 文献标识码 ADevelopment of an Intelligent Model Diagnosis for Children Com

3、mon Rash and Fever IllnessWang Qinghua, Tang Tian, Wang Qingqing, Liu Yaqiong, Lin Hui, Huang Guorong, Xiong Hongyan (Department of Military Epidemiology of Third Military Medical University, Chongqing, 400038, China)Abstract Objective To explore an intelligent diagnosis model of children common ras

4、h and fev-er illness (RFIs) for medical staff in rural area and family members. Methods The data of 248 RFIs cases(133 males and 115 females, at average age of 4.56) were collected from inpatients in the southwest hospital of the third military university in Jan 2005 to Nov 2010. Diseases including

5、measles, children's urgent rash, chick-en pox, hand-foot-and-mouth disease, scarlet fever, rubella, exanthema and so on. To organize and describe data features of rash, main with symptoms, blood tests and epidemiological relevant data, and carry out the Principal component analysis (PCA); Princi

6、pal component analysis (PCA) combined with back-propagation neural network(BPNN) was used to set up an intelligent diagnosis model for children common RFIs. We further confirmed the accuracy of the model for diagnosing children RFIs. Results Thirty-one clinical variables were synthesized into 13 fac

7、tors through PCA. These factors were then input to set up a BPNN with a 13-9-7 structure. When the model was used for children RFIs, the average accuracy rate of retrospective diagnosis reach up to 99.53%, and the average accuracy rate of predictive diagnosis is 92.86%,respectively. Conclusion These

8、 results suggest that the BPNN diagnosis model on the basis of clinical samples can be an accurate diagnosis of common fever a rash of disease in children, and possess obvious application prospect.Key words back-propagation neural network(BPNN);rash and fever illness(RFIs);principal component analys

9、is(PCA);intelligent diagnosis modelSupported by the National Key Technology Reseach and Development Program (2008BAD96B06-05). Corresponding author: Xiong Hongyan, Tel: 86-23-68752287, E-mail: hongyanxiong_基金项目 国家科技支撑计划(2008BAD96B06-05)通信作者 熊鸿燕,电话:(023)68752287,E-mail: hongyanxiong社区卫生服务是我国城乡地区卫生体系的

10、基础,是解决我国卫生发展所面临的体制性、机制性和结构性等重要问题的突破口。近年来,在政府部门的推动下,我国社区卫生服务得到蓬勃发展,但是,发展质量和速度与社会期待依然还有很大差距。其中,社区医生的技术水平、工作条件、社会支持与资源、公众健康意识和健康促进技能等问题是最为突出的制约基层医疗卫生稳步发展“瓶颈”1。医疗信息化是提高基层卫生服务水平的有效方法之一。国外研究者探索并评价了以地理信息、计算机模型、计算机网络和电讯服务为代表的信息传输应用在远程医疗、智能诊断、慢性病监测、健康数据收集、医疗继续教育等方面的作用。分析显示,这些技术在推动现代化卫生服务中,在快捷、经济、有效利用等方面展示出独特

11、的优势,是快速提高边远地区和落后地区卫生服务水平的有效手段2-5。人工神经网络(Artificial Neural Network,ANN)是近年来迅速发展起来的一种模仿生物大脑神经系统进行信息处理的数学模型。由于其模拟过程具有非线性映射和泛化功能特点,适合于复杂、多样、不完整和缺乏数学性质的临床数据分析,被广泛应用于疾病诊断研究,其中BP神经网络(Back-Propagation BP)是ANN应用最广的一种6,7。国内外研究者已经将其应用于间质性肺炎、肺结核、帕金森病、皮肤病等不同疾病的智能诊断,诊断正确率达81.0-95.08%,展示出可喜的开发前景8-12。本研究以发热出疹性疾病(ra

12、sh and fever illness , RFIs)病例数据为依据,以BP神经网络技术为平台,构建智能诊断模型并探讨其诊断价值,以期为基层社区医疗建立准确、简单、快速的小儿发热出疹性疾病诊断方法。1 资料与方法1.1资料来源及纳入标准本文纳入的疾病种类包括:麻疹、幼儿急疹、水痘、手足口病、猩红热、风疹和药疹,其中药疹虽不属于RFIs,但临床常见,与RFIs极易混淆,在此,将其作为一种鉴别诊断的疾病。收集2005年01月至2010年11月第三军医大学西南医院儿科、感染科的住院患者病历资料。纳入标准:1、有明确的诊断,符合上述7类疾病的临床诊断标准;2、18岁以下;3、治愈出院者;4、未合并其

13、他皮肤病者。经筛选,本研究共纳入病例248例,其中男性133例,女性115例,年龄范围为1月18岁,平均年龄4.56岁。通过对病例资料的综合分析,提取疾病相关因素、发热状况、皮疹特点、主要伴随症状、血常规5类31个特征指标(表1),构成了疾病样本库。按照疾病诊断结果分为7类:麻疹(51例)、幼儿急疹(49例)、水痘(32例)、手足口病(36例)、猩红热(31例)、风疹(20例)、药疹(29例)。表1 疾病临床特征指标特征类别特征名称疾病相关因素年龄,疫苗接种史,疫情接触史,疹前用药史发热状况发热出疹间隔,最高体温,出疹时体温,发热时间皮疹特点类型,首现部位,出疹顺序,大小,分布范围,主要分布,

14、密集程度,出齐时间,压之褪色,疹间皮肤,疹后脱屑和色素沉着,出疹时间主要伴随症状瘙痒,咳嗽,卡他,咽痛,杨梅舌、帕氏线和苍白圈,淋巴结肿大血常规白细胞计数,中性粒细胞比例,淋巴细胞比例1.2 临床资料的预处理原始临床资料中既有描述性资料也有定性、定量资料,因此需要将进行赋值、量化。例如:X1:(发热程度)0-无发热1-低热(37.3-38.0)2-中热(38.1-39.0)3-高热(39.1-41.0)4-超高热(>41)0-无 X2:(疹前服药史)1-有量化后的数据进行Z-score标准化处理,标准化公式:z = (xmean(x)/std(x), ( z为归一化后数值, x为原始数据

15、值, mean(x)、std(x)分别为原始数据的均值、标准差)。1.3 主成分分析主成分分析(principal component analysis, PCA),又称主分量分析,是利用降维的思想,通过线性组合,提取较少几个互不相关的综合变量(主成分)反映具有一定相关性的原始变量的绝大部分信息13,14,是一种常用的简化数据的多元统计分析方法。本文采用SPSS17.0软件,对31个临床特征变量进行主成分分析,消除变量的多重共线性,提取数据的最主要特征。1.4 网络模型结构的确立BP神经网络(Back-Propagation N)是迄今为止应用最广泛的人工神经网络。它是由输入层、隐含层和输出层

16、组成的多层前馈网络,采用误差反向传播(Error Back Proragation,BP)算法15。BP网络具有强大的非线性映射能力和泛化功能,任一连续函数或映射均可采用三层网络加以实现16。在MATLAB7.8环境下,采用Levenberg-Marquarthm学习算法(trainlm)17,建立一个三层前向BP网络模型。该网络包括输入层、隐含层和输出层,其中输入层神经元数等于输入样本的特征维数,即主成分分析得到的主成分个数;输出层神经元个数为7,输出变量采用“n中取1”表1000000,0100000,0000001分别代表7类疾病。隐含层神经元个数对于神经网络的性能影响较大18。目前为止

17、,隐含层神经元个数的选择还没有一个统一的标准,主要是通过经验和多次试验来确定。本文采用经验公式和 19,(l为隐含层神经元个数,n为输入神经元个数,m为输出神经元个数,a为1,10之间的常数)确定神经元个数的边界值,然后通过试验法来筛选最优模型。当网络训练误差和测试误差均小时,此时对应的隐含层神经元个数为最佳。网络输入层到隐含层传递函数为“tansig”,隐含层到输出层传递函数为“purelin”,学习算法为“trainlm”, 期望误差为0.001,最大迭代次数为200次,最小下降梯度为1e-10;其他设置为系统默认值。BP神经网络输出结果为连续数据,为将其转换为分类数据,本研究采用竞争函数

18、“compet”对原始输出进行处理。通过竞争,原始输出结果7个神经元中最大的神经元成为获胜神经元,显示为“1”,其余则为“0”。1.5 网络的训练采用MATLAB7.8软件的神经网络工具箱进行网络的训练与仿真。为了提高网络的泛化能力,防止“过拟合”,本研究采用“提前停止法”20进行训练。包含248例样本的样本集在训练之前按照60%、20%、20%的比例被随机划分为训练集(150例)、验证集(49例)和测试集(49例)。训练集用于对神经网络进行训练,验证集用于在训练的同时监控网络的训练进程,当验证误差增大到一定程度时,网络训练就会停止。测试集不经过训练,用于验证网络的泛化能力。图1表明开始阶段训

19、练集、验证集、测试集误差曲线变化一致,经过某一点时,验证集误差不再下降,但训练集误差继续减小。此点时模型泛化最好,经过此后,模型就会过度拟合(图1)。2 结果2.1 主成分分析主成分分析结果见表1。前13个主成分的累积方差贡献率为80.784%。可见,前13个因子基本上反映了原资料31个临床指标的绝大部分信息。根据方差累计贡献率大于80的原则3,因此,确定提取前13个主成分因子。表2 主成分特征根和方差贡献表(%)*主成分序号特征值各因子方差贡献度累积方差贡献度14.80915.51415.51424.15213.39328.90733.80812.28341.19042.5728.29749

20、.48751.8796.06155.54861.3984.51160.05971.2694.09564.15481.0083.25367.40790.9593.09370.500100.8742.82173.321110.8222.65175.972120.7672.47678.447130.7242.33780.784*表中只显示了被提取的前13个因子。2.1 BP网络结构PCA得到的13个因子作为网络输入,疾病类别作为输出,因此,输入层神经元个数为13,输出层神经元个数为7。通过计算,隐含层神经元个数的边界值为415。由不同隐含层神经元个数网络误差(图2),可以看出,随着隐含层神经元个数的

21、增加,训练误差、测试误差开始逐渐减小,而后又逐渐增大。当隐含层神经元个数为9时,测试误差最小;当为10时,训练误差最小。综合比较各隐含层神经元个数的训练误差和测试误差, 决定隐含层神经元个数选用9。最终确定的BP网络结构为13-9-7。2.1 BP网络训练和预测结果利用已经建好的BP神经网络模型对样本集进行训练。训练集、验证集、测试集误差曲线开始变化一致,经过6步训练即达到最优泛化点。说明数据集划分合理,三个数据集具有类似的特征,网络训练结果较为合理,无明显的过渡拟合发生(图1)。利用测试集样本对训练好的网络进行模拟预测,预测结果与实际结果见图3。反复进行10次训练、预测,结果见表4。训练集平

22、均诊断准确率为99.53%;验证集平均诊断准确率为93.47%;测试集平均诊断准确率92.86%;按照疾病划分,诊断准确率(表5)显示,麻疹、幼儿急疹、水痘、手足口病和猩红热诊断准确率较高,平均分别为99.02%、99.59%、99.06%、99.72%和97.10%;相对来说,风疹和药疹诊断准确率较低,风疹平均为86.50%;药疹平均为90.69%。结果表明,建立的模型对小儿发热出疹性疾病具有较高的诊断、预测能力。图1 BP网络训练图图2隐含层神经元个数与网络误差关系图3 测试集实际值与测试值表 4 各样本集10次训练诊断准确率(%)训练次数样本分组训练验证测试1100.0093.8893.

23、882100.0093.8893.883100.0095.9285.71499.3395.9293.885100.0091.8491.846100.0097.9695.927100.0085.7191.84898.0085.7195.92998.0097.9693.8810100.0095.9291.84平均99.5393.4792.86表5 各疾病10次训练后诊断准确率(%)训练次数疾病种类麻疹幼儿急疹水痘手足口病风疹猩红热药 疹1100.00100.0096.88100.0090.00100.0089.66298.04100.0096.88100.0095.0096.7793.10398.

24、04100.00100.0097.2295.0093.5586.214100.00100.00100.00100.0085.0096.7793.10598.0495.92100.00100.0095.00100.0086.216100.00100.00100.00100.00100.00100.0089.66798.04100.00100.00100.0080.0090.3289.668100.00100.00100.00100.0055.0096.7793.10998.04100.0096.88100.0085.0096.7796.5510100.00100.00100.00100.0085

25、.00100.0089.66平均99.0299.5999.0699.7286.5097.1090.693 讨论发热出疹性疾病(rash and fever illness,RFIs)是以发热、出疹为主要临床表现的儿童急症。主要包括麻疹、幼儿急疹、水痘、手足口病、猩红热以及风疹等。虽然这些疾病有其典型的症状和体症,有规范的诊断标准。但是,在基层社区,由于卫生人员的临床经验不足,却往往不能及时诊断,甚至误诊。这不仅延缓救治,还造成疫情传播。因此,为社区医疗平台提供此类疾病的智能诊断技术将有利于社区医疗RFIs的救治水平。本研究模型对7类小儿发热出疹性疾病的总体诊断准确率为92.86%,与其他文献报

26、道相近似。其中,麻疹、幼儿急疹、水痘、手足口病及猩红热准确率均在97%以上,风疹及药疹准确率相对较低,分别为86.50%,90.69%,显示有明显的应用价值。但是,由于本模型依据的病例资料全部来源于住院患者,其代表性不够全面,对于症状不典型的轻型或异型患者的诊断能力可能有限。因此,在进一步研究中,我们将实时收集样本量更大、临床类型更多的病例信息,以进一步改良模型。网络模型构建过程中,样本的选取、各层的设计及初始值决定着模型诊断效能。就样本量来说,对于建模的训练样本,一般来说,样本数越多越好。但样本的收集整理往往受到客观条件的限制。实践表明,网络训练所需的样本数取决于输入输出线性映射关系的复杂程

27、度,一般认为其样本量为其全部节点的210倍21。本研究样本应当在54270例,本研究为150例,说明样本量基本符合要求。此外,由于样本还要求应具有代表性,主要体现在:尽量使每个类别的样本数量大体相等,避免网络对样本数量多的类别“印象深”,面对出现次数少的类别“印象浅”; :在输入输入变量时应选择对输出影响大、彼此之间互不相关或相关性很小的变量。本研究通过主成分分析将原本对输出影响不显著、彼此相关的31个临床特征转换成13个对输出影响显著、互不相关的综合因子。转换后的13个因子作为输入变量,简化了模型结构,提高了模型效能。基本BP算法存在收敛速度慢,且易陷入局部极小点的缺点22,23。本研究采用

28、收敛速度最快的Levenberg-Marquarthm算法来加快收敛速度。此外还探索利用全局寻优能力良好的遗传算法与BP网络相结合,先用遗传算法进行寻优,将搜索范围缩小后,再利用BP网络来找到全局最小点,避免陷入局部极小点24。但在本模型中,经遗传算法优化后的网络诊断效能无明显改善,因此放弃采用遗传算法优化网络。其原因可能由于本研究构建的模型网络结构比较合理、输入变量特征明显所致。另外,本研究利用竞争学习的原理对输出结果进行了处理,去除了“噪声”干扰,规范了数据。使处理后的输出结果与实际结果更为接近,提高了诊断准确率。参考文献:1发改社会2010561号. 以全科医生为重点的基层医疗卫生队伍建

29、设规划Z. 2010.03.25.2David C, Gavin D, Mark M, et al. Computers in talk-based mental health interventionsJ. Interacting with Computers,2007,19(4):545-562.3Chih-Ming Chen. Web-based remote human pulse monitoring system with intelligent data analysis for home health careJ. Expert Systems with Application

30、s,2011,38(3):2011-2019.4Jui-Chen Huang. Remote health monitoring adoption model based on artificial neural networksJ. Expert Systems with Applications, 2010, 37(1):307-314.5Jahidul Hasan. Effective telemedicine project in Bangladesh: Special focus on diabetes health care delivery in a tertiary care

31、in Bangladesh J(in press). Telematics and Informatics, doi:10.1016/ j.tele. 2011.02.002.6李丽霞,张敏,郜艳晖,等. 人工神经网络在医学研究中的应用J. 数理医药学杂志,2009,22(1):80-82. 7谭文学,王细萍,席金菊,等. 基于BP神经网络模型的疾病确诊方法研究J. 计算机工程与设计,2011,32(3):1070-1073.8Abe Hiroyuki,Ashizawa Kazuto,Li Feng. Artificial neural networks (ANNs) for differen

32、tial diagnosis of interstitial lung disease: results of a simulation test with actual clinical casesJ. Acad Radiol, 2004, 11(1): 29-37. 9Er O, Temurtas F, Tanrkulu AC. Tuberculosis Disease Diagnosis Using Artificial Neural NetworksJ. Expert Systems with Applications, 2010,34(3): 299-302. 10常崇旺,高国栋,陈

33、洪,等. 人工神经网络诊断帕金森病的应用研究J.中国临床康复,2003, 7(28): 3818-3819.11白云静,申洪波,孟庆刚,等. 基于人工神经网络的中医证候非线性建模研究J. 中国中医药信息杂志, 2007,14(7):3-412刘延喜. 基于BP神经网络的皮肤病诊断方法J. 长春大学学报,2010,20(2):9-10.13杨中荣,毛广运,臧桐华,等. 用SAS和SPSS软件进行主成分分析. 中国卫生统计,2009,26(2):212-213. 14 Yang J, Frangi AF, Yang JY, et al. KPCA plus LDA: A complete kern

34、el fisher discriminant framework for feature extraction and recognitionJ. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(2):230-244. 15Rumelhart D B, Hinton G E, Williams R J. Learning internal representations by error propagation in parallel distributed processing: explora

35、tions in microstructure of cognition I.R. Cambridge. MA:MIT Press, 1986,318-362.16Robert Hecht-Nielson. Theory of the back-propagation neural network C. Proceeding of international Joint Conference on Neural Networks. Washington: IEEE,1989: 593-603.17Hagan, MT, Menhaj, M. Training feed forward netwo

36、rks with the Marquardt algorithmJ. IEEE Transactions on Neural Networks, 1994,5, 989-993.18傅荟璇, 主编. MATLAB神经网络应用设计M. 北京: 机械工业出版社, 2010: 90-91.19沈花玉,王兆霞,高成耀,等. BP神经网络隐含层单元数的确定J. 天津理工大学学报,2008, 24(5):13-15.20Hagiwara K. Regularization learning, early stopping and biased estimatorJ. Neurocomputing, 200

37、2, 48(1-4): 937-955.21梁毅冬BP神经网络在银行贷款分类中的应用J. 中国金融电脑, 2005: 59-62.22Brent, R. P. Fast training algorithms for multi-layer neural netsJ. IEEE Transactions on Neural Networks, 1991, 2:346-354.23Gori M, Tesi A. On the problem of local minima in back-propagationJ. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1992,14:76-85.24Lopes HFD, Abe JM, Anghinah R, Application of Paraconsistent Artificial Neural Networks as a Method of Aid in the Diagnosis of Alzheimer DiseaseJ. Journal of Medical Systems, 2010, 34(6): 1073-1081.(收稿:2011-09-xx;修回:2011-09-xx)(编辑 )

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1