主成分分析与医学应用.doc

上传人:scccc 文档编号:14134117 上传时间:2022-02-02 格式:DOC 页数:5 大小:111KB
返回 下载 相关 举报
主成分分析与医学应用.doc_第1页
第1页 / 共5页
主成分分析与医学应用.doc_第2页
第2页 / 共5页
主成分分析与医学应用.doc_第3页
第3页 / 共5页
主成分分析与医学应用.doc_第4页
第4页 / 共5页
主成分分析与医学应用.doc_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《主成分分析与医学应用.doc》由会员分享,可在线阅读,更多相关《主成分分析与医学应用.doc(5页珍藏版)》请在三一文库上搜索。

1、主成分分析与医学应用10 级 GIS 班 沈娅男 100154022在社会经济各方面的问题的研究中, 问题的解决常常牵涉到许多层面和变量 因素,各因素间往往会存在一定的相关关系。 变量因素太多, 无疑会增加分析问 题的难度和复杂性, 因此,我们很容易联想到在相关关系分析的基础上, 用尽可 能少的新变量来拟合代替原来较多的变量, 而尽可能多的保留原来变量所反映的 信息,这就是主成分分析方法。主成分分析方法反映了一种降维处理和分析的思维方法, 在解决各种复杂问 题时往往能起到意想不到的作用。 在这里,我着重想要体现主成分分析在医学研 究中的应用。 一方面是因为医学与人类的健康密切相关, 医学的发展

2、关系到人类 最根本的福祉; 另一方面是因为医学具备巨大的实践价值, 医学的研究成果可以 发展生产力从而带动国民经济的发展。 近年来,由于统计学的发展和各种技术的 进步,对数据进行各种定量分析已被广泛应用于医学研究中。 主成分分析方法也 被广泛使用。在这里我选择了一个案例来说明主成分分析在医学研究中的作用。 分析的数 据来自中国主要年份儿童保健情况统计( 19962007)年份出生体 重小于围产儿死亡率0新生儿破 伤风发病 率(1/万)新生儿 破伤风 死亡率(1/ 万)五岁以 下儿童1 Jt-rr-新生儿访视 率%三岁以 下儿童 系统管 理率%七岁以下 儿童保健 管理率%两千五百克比重%中重度

3、营养不 良比 重%1,99614.444.122.903.7381.4061.4162.701,9972.3115.144.162.973.5182.3865.6565.831,9982.5814.942.741.863.4183.7469.0768.891,9992.3914.222.241.483.2985.4272.3471.772,0002.4013.991.881.163.0985.8073.8473.372,0012.3513.281.410.843.0186.2774.6574.472,0022.3912.471.330.732.8386.1273.8874.032,0032.2

4、612.241.400.832.7084.6572.7772.682,0042.2011.080.980.512.5684.9673.7374.442,0052.2110.270.770.392.3485.0373.8874.792,0062.229.680.640.322.1084.7073.9075.002,0072.268.710.470.202.0285.5974.3975.89本例中有9个变量,分别是年份、出生体重小于两千五百克比重、 围产儿童死亡 率、新生儿破伤风发病率、新生儿破伤风死亡率、五岁以下儿童中重度营养不良 比重、新生儿访视率、三岁以下儿童系统管理率、七岁以下儿童保健管理

5、率。然 后按下列步骤计算(利用SPSS软件):(1)、计算相关系数矩阵:我利用SPSS软件求得了除年份以外的另外八个变量 之间的相关系数矩阵,结果如下表,从表中可以看出,各变量之间具有一定的相 关关系而且有些相关系数还比较大,接近于1,所以本例很适合使用主成分分析。相关矩阵岀生围产新生儿新生儿五岁以新生三岁以七岁以下体重儿死破伤风破伤风下儿童儿访下儿童儿童保健小于两千五百 克比重亡率发病率死亡率中重度 营养不 良比重视率系统管理率管理率出生体重 小于两千 五百克比 重1.000.331-.064-.075.142.439.355.234围产儿死亡率.3311.000.848.833.970-.

6、429-.607-.730新生儿破伤风发病率-.064.8481.000.999.918-.807-.918-.966新生儿破伤风死亡率-.075.833.9991.000.905-.820-.924-.968五岁以下 儿童中重 度营养不 良比重.142.970.918.9051.000-.563-.748-.842新生儿访视率.439-.429-.807-.820-.5631.000.950.910三岁以下儿童系统管理率.355-.607-.918-.924-.748.9501.000.985七岁以下儿童保健管理率.234-.730-.966-.968-.842.910.9851.000(2

7、) 、计算各成分的特征值、方差贡献率和累积贡献率,结果如下:解释的总方差成份初始特征值提取平方和载入合计方差的%累积%合计方差的%累积%16.08476.05276.0526.08476.05276.05221.58119.75895.8101.58119.75895.8103.2653.31099.1204.039.48399.6035.028.35599.9586.003.03499.9927.001.00799.9988.000.002100.000提取方法:主成份分析。由表可知,只有前两个变量因素的特征值大于1因此选择前两个作为主成分,第一主成分的方差贡献率是76.052%,前两个主成

8、分的方差占所有成分方差的95.810%,由此可见,前两个主成分已足够代替原来的变量,几乎涵盖原变量的 全部信息。(3) 、计算主成分载荷,得到以下的成分矩阵:成份矩阵成份F 1F 2出生体重小于两千五百克比重-.134.932围产儿死亡率.820.537新生儿破伤风发病率.992.074新生儿破伤风死亡率.991.056五岁以下儿童中重度营养不良比重.906.357新生儿访视率-.853.439三岁以下儿童系统管理率-.951.280七岁以下儿童保健管理率-.988.129提取方法:主成份。a.已提取了 2个成份。从中可以得到两主成分的表达式,即:F1 = -0.134*出生体重小于两千五百克

9、比重 +0.820* 围产儿死亡率 +0.992*新生儿 破伤风发病率 +0.991* 新生儿破伤风死亡率 +0.906*五岁以下儿童中重度营养不 良比重 -0.853*新生儿访视率 -0.951*三岁以下儿童系统管理率 -0.988*七岁以下儿 童保健管理率 同理可得 F2 的表达式 (4)、得出结论: 在第一主成分中, 除了出生体重小于两千五百克比重以外的变 量的系数都比较大; 在第二主成分中变量出生体重小于两千五百克比重的系数比 较大,可以看做是反映变量出生体重小于两千五百克比重的指标。 这样,我们就用这两个主成分概括了所有的指标, 描述了中国主要年份儿童的保 健情况。从该案例中可以看出主成分分析具有化繁为简, 简明清晰的优点, 用最少的成分 概括了原来纷杂的变量之间的联系。 该统计分析法不失为解决实际应用问题的一 个有力工具。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1