1、多水平结构方程模型MSEM北京师范大学心理学院刘红云2021/6/161主要内容2021/6/162中介模型概念(Hyman,1955;James&Brett,1984;Judd&Kenny,1981;Baron&Kenny,1986)中介模型对心理学研究的意义伍德沃兹伍德沃兹S-O-R模型是最早的中介模型之一模型是最早的中介模型之一中介模型是许多心理学理论的形成基础中介模型是许多心理学理论的形成基础(MacKinnon,Fairchild,Fritz,2007)认知失知失调中介模型中介模型X:态度与行度与行为不一致不一致Y:态度或行度或行为调整改整改变M:心理:心理紧张中介模型可指导干预模式
2、设计中介模型可指导干预模式设计青少年吸烟干青少年吸烟干预模式模式X:干:干预训练Y:吸烟行:吸烟行为M:抵制吸烟技能:抵制吸烟技能研究中介模型是对心理学研究方法的促进补充研究中介模型是对心理学研究方法的促进补充2021/6/164中介模型类型模型记号X变量M变量Y变量2-2-2位于水平2位于水平2位于水平22-2-1位于水平位于水平2位于水平位于水平2位于水平位于水平12-1-2位于水平2位于水平1位于水平22-1-1位于水平位于水平2位于水平位于水平1位于水平位于水平11-2-2位于水平1位于水平2位于水平21-2-1位于水平1位于水平2位于水平11-1-2位于水平1位于水平1位于水平21-
3、1-1位于水平位于水平1位于水平位于水平1位于水平位于水平1以两水平中介模型为例,根据X、Y和M所在的层级不同,理论上说可能的中介模型有八种类型:2021/6/165常见的三种模型第二水平 2-2-1模型第一水平XMYacb第二水平 2-1-1模型第一水平XMYabjc 第二水平 1-1-1模型 第一水平XajMbjYcj2021/6/166中介效应分析程序估计:a b(温忠麟、(温忠麟、张雷、侯杰泰、刘雷、侯杰泰、刘红云云,2004)检验:传统中介模型可能遇到的问题当变量具有多水平结构时 忽视数据的多水平结构和相似性将导致效应估计有偏(Raudenbush&Bryk,2002)低估标准误,增
4、大统计一类错误概率(Barcikowski,1981;Moulton,1986;Scariano&Davenport,1987)X:组织氛氛围M:工作:工作满意度意度Y:留:留职意向意向第一水平:第一水平:员工水平工水平第二水平:第二水平:组织水平水平同一同一组织内部的内部的员工比工比较相似相似2021/6/168处理独立性假理独立性假设不成立不成立导致的估致的估计标准准误偏小的偏小的问题的的传统方法方法(Krull&MacKinnon,1999)选用更为严格的显著性水平(即更小的)仍然有偏,没能校正观测独立性不成立带来的问题。使用跨级相关系数ICC并非最优,且没有考虑数据的层级结构关系。将较
5、低一层水平的分数合成在较高一层的水平上进行数据分析统计检验力下降;同样两个变量在较高水平和较低水平上的关系可能不同;数据间的变异不一定存在于较高水平;研究感兴趣的问题可能发生在较低水平而非较高水平。2021/6/169处理独立性假理独立性假设不成立不成立导致的估致的估计标准准误偏小的偏小的问题的的传统方法方法(Krull&MacKinnon,1999)选用更为严格的显著性水平(即更小的)仍然有偏,没能校正观测独立性不成立带来的问题。使用跨级相关系数ICC并非最优,且没有考虑数据的层级结构关系。将较低一层水平的分数合成在较高一层的水平上进行数据分析统计检验力下降;同样两个变量在较高水平和较低水平
6、上的关系可能不同;数据间的变异不一定存在于较高水平;研究感兴趣的问题可能发生在较低水平而非较高水平。2021/6/1610处理独立性假理独立性假设不成立不成立导致的估致的估计标准准误偏小的偏小的问题的的传统方法方法(Krull&MacKinnon,1999)选用更为严格的显著性水平(即更小的)仍然有偏,没能校正观测独立性不成立带来的问题。使用跨级相关系数ICC并非最优,且没有考虑数据的层级结构关系。将较低一层水平的分数合成在较高一层的水平上进行数据分析统计检验力下降;同样两个变量在较高水平和较低水平上的关系可能不同;数据间的变异不一定存在于较高水平;研究感兴趣的问题可能发生在较低水平而非较高水
7、平。2021/6/1611多水平中介模型及其实质多水平模型的分析框架多水平模型的分析框架中介分析中介分析传统中介模型中介模型扩展到展到多水平多水平结构数据构数据解决办法解决办法多水平中介模型多水平中介模型 (Kenny,Kashy,&Bolger,1998)2021/6/1612多水平中介模型分类2021/6/1613多水平固定中介效应模型2021/6/1614固定中介效应的多水平路径模型截距截距随机,即允许截距在不同组间存在差异这一随机系数的定义从模型上可以考虑多水平数据组内观测之间存在相关的特点斜率(路径系数)斜率(路径系数)均固定2021/6/16152-2-1固定中介效应模型2-2-1
8、对应的固定中介效的固定中介效应模型方程模型方程为:水平1:水平2:水平2:水平1:水平2:2021/6/16162-1-1固定中介效应模型2-1-1对应的固定中介效的固定中介效应模型方程模型方程为:水平1:水平2:水平1:水平2:水平1:水平2:2021/6/16171-1-1固定中介效应模型1-1-1对应的固定中介效的固定中介效应模型方模型方程程为:水平1:水平2:水平1:水平2:水平1:水平2:2021/6/1618注意在多水平模型中,中介效应的两种表示c-c和ab并不相等(Krull&MacKinnon,1999)选择c-c还是ab?根据具体关心的问题决定2021/6/1619多水平随机
9、中介效应模型2021/6/1620随机中介效随机中介效应模型模型截距截距随机斜率(路径系数)斜率(路径系数)随机2021/6/16212-2-1随机中介效应模型2-2-1模型模型一定是固定效应的可用两步方法估计中介效应第一步:用最小二乘回归估计X对M的效应第二步:用多水平模型估计M和X对Y的同时效应中介效应及其标准误都可以按照传统的单一水平中介模型计算2021/6/16222-1-1随机中介效应模型2-1-1对应的随机中介效的随机中介效应模型方程模型方程为:水平1:水平2:水平1:水平2:水平1:水平2:2021/6/16232-1-1随机中介效应模型2-1-1模型M预测Y的路径系数允许在第二
10、水平组间变化可用两步多水平模型估计中介效应第一步:估计X对M的效应(随机截距模型)第二步:估计M和X对Y的同时效应(随机斜率模型)平均中介效应可由 计算;平均中介效应的标准误可以按照传统的单一水平中介模型计算得到。2021/6/16241-1-1随机中介效应模型1-1-1对应的随机的随机中介效中介效应模型方模型方程程为:水平1:水平2:水平1:水平2:水平1:水平2:2021/6/16251-1-1随机中介效应模型该模型需要满足传统中介模型假设和一般的多水平模型假设:(1)eMij与eYij独立;(2)Mij与eYij独立;(3)方程2中Xij与Mij对Yij的预测没有交互作用;(4)第一水平
11、的残差项eMij、eYij符合正态分布;(5)第二水平的残差项uM0j、uM1j、uY0j、uY1j、uY2j符合多元正态分布;(6)第一水平和第二水平的残差项相互独立。2021/6/16261-1-1随机中介效应模型此外,为了保证模型可估和效应估计的无偏性,该模型还需要满足作为多变量多水平模型的特殊假设:(1)预测变量与任何一个方程中的随机效应和残差都不相关。(2)各个方程的残差项正态分布,期望值为0,彼此不相关,每一个第二层组内的残差项独立且同方差。(3)随机效应正态分布,以总体平均效应为均值。各随机效应间存在相关。(4)第一水平的残差与任何一个方程中的随机效应都不相关。(5)M在X条件下
12、正态分布(给定X的条件下,M是正态分布),Y在X和M条件下正态分布。2021/6/16271-1-1随机中介效应模型中介效应均值中介效应方差估估计困困难2021/6/16281-1-1随机中介效应模型X对Y预测的总效应的均值总效应的方差(假设随机部分服从正态分布)2021/6/1629估估计 的方法的方法(1)Kenny等人(2003)两步估计方法难以获得标准误(2)L.Muthn和B.Muthn(2007)直接在Mplus中估计随机效应协方差难以推广到三水平中介模型(3)Bauer等人(2006)加入选择变量使得aj和bj出现在同一个方程中。其中,Z代表M,SM=1,SY=0;Z代表Y,SM
13、0,SY=1。易于理解2021/6/1630估估计 的方法的方法(1)Kenny等人(2003)两步估计方法难以获得标准误(2)L.Muthn和B.Muthn(2007)直接在Mplus中估计随机效应协方差难以推广到三水平中介模型(3)Bauer等人(2006)加入选择变量使得aj和bj出现在同一个方程中。其中,Z代表M,SM=1,SY=0;Z代表Y,SM=0,SY=1。易于理解2021/6/1631估估计 的方法的方法(1)Kenny等人(2003)两步估计方法难以获得标准误(2)L.Muthn和B.Muthn(2007)直接在Mplus中估计随机效应协方差难以推广到三水平中介模型(3)B
14、auer等人(2006)加入选择变量使得aj和bj出现在同一个方程中。其中,Z代表M,SM=1,SY=0;Z代表Y,SM=0,SY=1。易于理解2021/6/1632构造多水平中介效应置信区间的方法乘积分布法Bootstrap方法MCMC方法2021/6/1633极大似然估计方法:极大似然估计方法:已知某个参数能使似然函数最大,就把这个参数作为真值的估计。限制性极大似然估计方法限制性极大似然估计方法:不同于极大似然估计方法之处,在于考虑了自由度。最小方差二次无偏估计方法最小方差二次无偏估计方法:在无偏估计中,具有最小方差。多水平随机中介效应模型估计方法2021/6/1634Multilevel
15、 Estimation,Testing,Modification,And IdentificationEstimatorsMuthns limited information estimator(MUML)random interceptsESTIMATOR=MUMLMuthns limited information estimator for unbalanced dataMaximum likelihood for balanced dataFull-information maximum likelihood(FIML)random intercepts and random slop
16、esESTIMATOR=ML,MLR,MLFFull-information maximum likelihood for balanced and unbalanced dataRobust maximum likelihood estimatorMAR missing dataAsparouhov and Muthn2021/6/1635Multilevel Estimation,Testing,Modification,And IdentificationTests of Model FitMUML chi-square,robust chi-square,CFI,TLI,RMSEA,a
17、nd SRMRFIML chi-square,robust chi-square,CFI,TLI,RMSEA,and SRMRFIML with random slopes no tests of model fitModel ModificationMUML modification indices not availableFIML modification indices availableModel identification is the same as for CFA for both the between and within parts of the model.2021/
18、6/1636变量中心化量中心化问题多水平模型通常对第一水平的预测变量做某种中心化:总均值中心化(grand mean centering)组均值中心化(group mean centering)一般用于ICC很小,即组间方差很小,或研究者不关心组间效应时2021/6/1637应用及Mplus举例2021/6/1638例例1例例 再次使用PISA2003年香港测试数据,演示最简单的多水平中介效应模型的应用。假设家庭学习资源(HOMEPOS)通过影响学生的数学学业效能(MATHEFF)影响学生的数学成绩(MATH),这三个变量均为学生水平的观测变量。2021/6/1639例例1 固定中介效固定中介
19、效应模型模型固定中介效固定中介效应模型模型的Mplus语句:TITLE:multilevel mediation analysis with fixed slopes in 1-1-1 path model;DATA:File is PATH.dat;FORMAT F5.0 3F10.4;VARIABLE:Names are SCHOOL MATHEFF HOMEPOS MATH;missing is ;cluster is SCHOOL;ANALYSIS:Type is twolevel MISSING;iterations is 5000;H1CONVERGENCE=0.01;2021/6
20、/1640例例1 固定中介效固定中介效应模型模型(续)MODEL:%within%MATH ON HOMEPOS;MATH ON MATHEFF;MATHEFF ON HOMEPOS;%between%MATH with MATHEFF;OUTPUT:2021/6/1641例例1 随机中介效随机中介效应模型模型随机中介效随机中介效应模型模型的Mplus语句:TITLE:multilevel mediation analysis with random slopes in 1-1-1 path model;DATA:File is PATH.dat;FORMAT F7.0 3F10.4;VARI
21、ABLE:Names are SCHOOL MATHEFF HOMEPOS MATH;missing is ;cluster is SCHOOL;ANALYSIS:Type is twolevel RANDOM MISSING;iterations is 5000;H1CONVERGENCE=0.01;2021/6/1642例例1 随机中介效随机中介效应模型模型 MODEL:%within%S1|MATH ON HOMEPOS;S2|MATH ON MATHEFF;S3|MATHEFF ON HOMEPOS;%between%MATH with MATHEFF;S1 WITH S2;S1 WI
22、TH S3;S2 WITH S3;OUTPUT:2021/6/1643例1 模型结果固定斜率和随机斜率的中介效固定斜率和随机斜率的中介效应模型模型拟合指合指标H0自由参数Akaike(AIC)Bayesian(BIC)Adjusted BIC固定斜率-35702.81071425.771489.871458.0随机斜率-35679.71671412.971515.471464.5随机斜率模型由于比固定斜率模型稍微复杂,但是在模型拟合与固定斜率模型没有差异,因此在实际应用中可以选用固定斜率模型。2021/6/1644固定中介效应模型随机中介效应模型参数估计值标准误Z值估计值标准误Z值固定(或平均
23、效应截距MATH552.725.710 96.797550.444.571 120.411MATHEFF0.1240.0363.4620.1690.0335.091斜率a(MATHEFFHOMEPOS)0.1920.0267.4160.1970.0258.001b(MATH MATHEFF)33.5871.202 27.94633.7101.19628.189c(MATH HOMEPOS)5.6561.6713.3846.7121.6444.084水平1的残差MATHEFF0.8570.028 30.9540.8500.02830.291MATH4078.72 129.788 31.426
24、4026.56 125.00532.211水平2的残差方差MATHEFF0.1590.0198.3960.1270.0168.011MATH4558.78 441.414 10.328 2857.54 302.9139.434a0.0160.0091.899b38.34823.3381.643c54.76438.1451.436协方差MATH 与 MATHEFF25.7422.5949.92517.7091.8169.752a 与 b-0.1220.299-0.407a 与 c0.1490.4740.315b 与 c-14.76123.461-0.629固定中介效固定中介效应模型模型中介效应为
25、ab=6.449家庭学习资源对学生数学成绩的总效应为6.449+5.656=12.105显著著学生数学成绩和学业效能存在显著的学校间差异2021/6/1645固定中介效应模型随机中介效应模型参数估计值标准误Z值估计值标准误Z值固定(或平均)效应截距MATH552.725.710 96.797550.444.571 120.411MATHEFF0.1240.0363.4620.1690.0335.091斜率a(MATHEFFHOMEPOS)0.1920.0267.4160.1970.0258.001b(MATH MATHEFF)33.5871.202 27.94633.7101.19628.18
26、9c(MATH HOMEPOS)5.6561.6713.3846.7121.6444.084水平1的残差MATHEFF0.8570.028 30.9540.8500.02830.291MATH4078.72 129.788 31.426 4026.56 125.00532.211水平2的残差方差MATHEFF0.1590.0198.3960.1270.0168.011MATH4558.78 441.414 10.328 2857.54 302.9139.434a0.0160.0091.899b38.34823.3381.643c54.76438.1451.436协方差MATH 与 MATHEF
27、F25.7422.5949.92517.7091.8169.752a 与 b-0.1220.299-0.407a 与 c0.1490.4740.315b 与 c-14.76123.461-0.629随机中介效随机中介效应模型模型平均中介效应为=6.641-0.122=6.519家庭学习资源对学生数学成绩的总效应平均为 6.519+6.712=13.231显著著学校学校间差异差异边缘显著著2021/6/1646例2-Two-Level SEM:Random SlopesFor Regressions Among Factors2021/6/1647例2 Mplusinput代码2021/6/16
28、48例2 Mplusinput代码2021/6/1649例2 Mplusoutput结果2021/6/1650例2 Mplusoutput结果2021/6/1651例2 Mplusoutput结果2021/6/1652例2 Mplusoutput结果2021/6/1653例2 Mplusoutput结果2021/6/1654多水平模型多水平模型 多水平模型的优点 准确的标准误 准确的一类错误率 合适的统计检验力 多水平中介效应分析实例 针对学校的戒酒项目中的多水平中介效应分析(Komro et al.,2001)暴力犯罪的社区效应中的多水平中介效应分(Sampson,Raudenbush,&E
29、arls,1997)55例子:治例子:治疗抑郁症的研究抑郁症的研究自变量:认知行为治疗组vs.认知行为治疗加练习组中介变量:6周后进行的健康量表测量因变量:12周后进行的幸福感量表测量 数据呈现多水平结构:ICC 的值为0.43 F(15,96)=6.30,p .0156例子:治例子:治疗抑郁症的研究抑郁症的研究 数据57例子:治例子:治疗抑郁症的研究抑郁症的研究 中介效应分析忽略组水平在个体水平分析 中介效应显著将个体水平数据合并到组水平,在组水平分析 中介效应不显著多水平中介效应分析CM:将M进行组中心化后的变量MEANM:将M进行总体中心化后的变量WITHINM:将M进行组内中心化后的变
30、量58例子:治例子:治疗抑郁症的研究抑郁症的研究 Mplus进行多水平中介效应模型分析 对所有变量规定嵌套的数据结构(TYPE IS COMPLEX)在每个水平定义变量之间的关系(TYPE IS TWOLEVEL)59例子:治例子:治疗抑郁症的研究抑郁症的研究 使用COMPLEX选项的Mplus语句60例子:治例子:治疗抑郁症的研究抑郁症的研究 使用COMPLEX选项的Mplus结果(部分)61例子:治例子:治疗抑郁症的研究抑郁症的研究使用COMPLEX选项的Mplus结果计算62例子:治例子:治疗抑郁症的研究抑郁症的研究使用TWOLEVEL选项的Mplus语句 and63例子:治例子:治疗抑
31、郁症的研究抑郁症的研究使用TWOLEVEL选项的Mplus语句64例子:治例子:治疗抑郁症的研究抑郁症的研究 使用TWOLEVEL选项的Mplus结果(和 )65例子:治例子:治疗抑郁症的研究抑郁症的研究 使用TWOLEVEL选项的Mplus结果()66例子:治例子:治疗抑郁症的研究抑郁症的研究使用TWOLEVEL选项的Mplus结果计算67含有随机系数的多水平中介效含有随机系数的多水平中介效应模型模型 更复杂的情况:系数可能在不同组之间变化 低水平的中介效应模型:自变量,中介变量和因变量是在高水平上有随机项的连续变量 举例:记录被试每天的压力源,付出的努力和情绪状态。每天的记录是第一水平,被
32、试是第二水平。在这个多水平中介效应模型中 可能在被试间不同。68含有随机系数的多水平中介效含有随机系数的多水平中介效应模型模型中介效中介效应69含有随机系数的多水平中介效含有随机系数的多水平中介效应模型模型 Mplus 程序70多水平分析需要注意的问题2021/6/1671组内相关系数的大小(内相关系数的大小(ICC)ICC的大小依赖于组的数目过小的ICC值可以被忽略,但是有关组间变量的信息可能会有所损失ICC值会因个体水平的测量误差而减小ICC不是总会表现出组水平上的效应2021/6/1672样本量大小本量大小至少有30-50个组(组间水平单元个数)组水平的变量可以只对应一个观测变量2021/6/1673组内水平和组间水平的变量个体水平测量的变量可以同时用于模型的组间或组内部分,或只用于模型的组内部分(WITHIN=)组水平测量的变量只可用于模型的组间部分(BETWEEN=)2021/6/1674谢谢!2021/6/1675 结束束语若有不当之处,请指正,谢谢!若有不当之处,请指正,谢谢!