Matlab学习系列33.泰尔指数及分解.doc

上传人:scccc 文档编号:11421058 上传时间:2021-08-04 格式:DOC 页数:5 大小:93.50KB
返回 下载 相关 举报
Matlab学习系列33.泰尔指数及分解.doc_第1页
第1页 / 共5页
Matlab学习系列33.泰尔指数及分解.doc_第2页
第2页 / 共5页
Matlab学习系列33.泰尔指数及分解.doc_第3页
第3页 / 共5页
Matlab学习系列33.泰尔指数及分解.doc_第4页
第4页 / 共5页
Matlab学习系列33.泰尔指数及分解.doc_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《Matlab学习系列33.泰尔指数及分解.doc》由会员分享,可在线阅读,更多相关《Matlab学习系列33.泰尔指数及分解.doc(5页珍藏版)》请在三一文库上搜索。

1、33.泰尔指数及分解一 泰尔指数泰尔指数 (Theil index) 或者泰尔熵标准(Theilentropy measure泰是由泰尔 (Theil,1967)利用信息理论中的熵概念来计算收入不平等而得名。熵在信息论中被称为平均信息量。在信息理论中,假定某事件E将以某概率p发生,而后收到一条确定消息证实该事件E的发生,贝吐匕消息所包含的信息量用公式可以表示为:1h(p) = l n(-)P设某完备事件组由各自发生概率依次为(PsP?,,p n)由n个事件n(巳任2,En)构成,则有瓦p = 1,熵或者期望信息量等于各事件的信息i T量与其相应概率乘积的总和:nn1nH(x)八 Pih(pJ

2、八 Pilog(-)-、Pilog(p(1)i =1idpii 丄将信息理论中的熵指数概念用于收入差距的测度时, 可将收入差距的测度解 释为将人口份额转化为收入份额(类似于洛伦兹曲线中将人口累计百分比信息转 化为收入累计百分比)的消息所包含的信息量。而泰尔指数只是熵指数中的一个 应用最广泛的特例。泰尔指数的表达式为:n i弓I?)其中,T为收入差距程度的测度泰尔指数,丫匚表示第i个体的收入,y表示所有 个体的平均收入对于分组数据,泰尔指数有另一种表达式:wiWi ln()其中,w表示第i组收入占总收入的比重,e表示第i组人口数占总人口数的比 重。例1.工w花回霸耶羽话上乜jjjjli 匚 a二

3、/r 三jd *II IIi f i fExact Salary$100,000$80,000$60,000$40,000$20,000For this data, Thetis T Statistic = 0.079078221Individuals in the top salary group con tribute large positive elements. Individuals in the middle salaiy grcup contribute nothmg to Thed*s T Statistic because their salaries are equal

4、to the population average. Eidividuak in the ttottom salary group contnbute large negative elements.(I)按公式计算:fun ctio nT=Theil2(x)%函数Theil2()计算泰尔指数,反映收入水平的差异%其中,x为n个个体的收入xx=x./mea n( x);T=mea n( xx.*log(xx);主程序:y2=10 10 8 8 8 8 6 6 6 6 6 6 4 4 4 4 2 2;%每个个体的收入(万美元)T2=Theil2(y2)运行结果:T2 = 0.0791(II)按公

5、式计算:fun ctio nT=Theil(y,p)%函数Theil()计算泰尔指数,反映收入水平的差异%其中,y为各组的平均收入;p为各组包含的个体数w=y.*p/sum(y.*p);e=p./sum(p);T=sum(w.*log(w./e);主程序:y=10 8 6 4 2;%各组的平均收入(万美元)p=2 4 6 4 2;%各组包含的个体数T=Theil(y,p)运行结果:T = 0.0791二.泰尔指数分解法泰尔指数作为收入不平等程度的测度指标具备良好的可分解性质,即将样本分为多个群组时,泰尔指数可以分别衡量组内差距与组间差距对总差距的贡献。假设包含n个个体的样本被分为K个群组,每组

6、分别为gk(k = 1,,K),第k组Kgk中的个体数目为nk,则有a m二n,yi表示个体i的收入份额(占总收入的 比例),yk表示第k组的收入份额(占总收入的比例),记Tb与T,分别为组间 差距和组内差距,则可将泰尔指数分解如下:KK/T二兀Tw八yj n、yd、仏l n严)心nn 心ilkf nk在上式中组间差距Tb与组内差距Tw分别有如下表达式:K兀八yk ln *心氐nTw八“ y纠n詈)2rgk yk 1 nk另外,值得注意的是组内差距项分别由各组的组内差距之和构成,各组的组内差距的计算公式与样本总体的计算公式并无二致,只是将样本容量控制在第 组的个体数目nk例2还是例1的数据,计

7、算组间差距Tb与组内差距 Tw,验证泰尔指数T = Tb fun ctio nTb,Tw=TbTw(x, n)%函数TbTw()计算泰尔指数分解,返回Tb为组间差距,Tw为组内差距%泰尔指数T=Tb+Tw%乂为N个个体的收入向量,依次分为K个分组%n=n1,.,nK为各分组的个体数向量,sum(n)=NK=le ngth( n);s=0,cumsu m(n);for k=1:KXk=x(s(k)+1:s(k+1)./sum(x);%Xk为第k个分组的nk个个体的收入份额(占总收入的比例)y(k)=sum(Xk);%y(k)为第k组的收入份额(占总收入的比例)endTb=sum(y.*log(y

8、./( n./len gth(x);%组间差距for k=1:Kz(k)=sum(Xk./y(k).*log( n(k)*Xk./y(k);%第 k组的组内差距endTw=sum(y*z);%总的组内差距为各分组组内差距的加权和主程序:x=10 10 8 8 8 8 6 6 6 6 6 6 4 4 4 4 2 2;%每个个体的收入(万美元)Tb,Tw=TbTw(x,n)运行结果:Tb =0.0791Tw =-3.7007e-17说明:由于该例中, 每个分组内各个个体的收入是相同的, 故每个分组的组内差距为0,总的组内差距 Tw也为0,结果中的-3.7007e-17是由于Matlab中 的双精度

9、误差造成的,相当于是0.例3 修改例 1中的数据,让各分组的个体收入不相等,继续测试上述算法。原第 1 组:10、10,改为 9.5、10.5原第 2 组:8、8、8、8,改为 7、9、7.5、8.5原第 3 组:6、6、6、6、6、6 改为 5、7、5.5、6.5、6、6原第 4 组:4、4、4、4 改为 3、5、3.5、4.5原第 5 组:1.5、2.5主程序 :x2=9.5 10.5 7 9 7.5 8.5 5 7 5.5 6.5 6 6 3 5 3.5 4.5 1.52.5;%每个个体的收入 ( 万美元)n=2 4 6 4 2;%各分组的个体数Tb,Tw=TbTw(x2,n)T=Theil2(x2)Tb+Tw运行结果 :Tb = 0.0791Tw = 0.0077T =0.0868ans = 0.0868

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1