统计描述的Stata实现.docx

上传人:李医生 文档编号:11654385 上传时间:2021-08-28 格式:DOCX 页数:21 大小:45.27KB
返回 下载 相关 举报
统计描述的Stata实现.docx_第1页
第1页 / 共21页
统计描述的Stata实现.docx_第2页
第2页 / 共21页
统计描述的Stata实现.docx_第3页
第3页 / 共21页
统计描述的Stata实现.docx_第4页
第4页 / 共21页
统计描述的Stata实现.docx_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《统计描述的Stata实现.docx》由会员分享,可在线阅读,更多相关《统计描述的Stata实现.docx(21页珍藏版)》请在三一文库上搜索。

1、第二章统计描述的Stata实现本章主要用到的Stata主要命令*描述性统计:summary 变量名weight = , detail频数表:tabulate 变量名weight =计算均数:means 变量名weight =频数分布图:histogram 变量名,bin() start ()*Stata的命令可以用前几个字母代替,如summary可以由su代替tabulate可 以由tab代替。下面就直接用缩写,不再赘述。例2-1某市1982年调查120名20岁男子的身高(cm)资料如下,试编制频数 表和频数图。164.4169. 2174. 7175.0165.0162.8170. 2160

2、. 1170.9170. 1175. 5170. 3172. 3168.2166. 7171.7166. 8171.6165.2172.0171. 7168.8171.8174.5171. 7172.7166. 3174.0169.0174. 5171.8174.9180. 0173. 5178. 1169.7176. 1181. 3173.8164. 7172.2172.8178.6172.0182.5172.0173. 5166. 3176. 1169.2176.4168.4171.0169. 1166. 9181. 1170.4165.2168.0172.4164. 3166.9176.

3、4164.2177.2168.3177.8173.0167.4173.2169.9172. 1170.4174.8172. 1164.4170. 5165.0172.8166.8175.8171. 1174.8172. 7169.4178.2174. 1177.2170.0172. 7168. 3177. 1172. 5166. 3175. 1174.4162. 3171. 3177.0163. 5168.8177.6175.2171.5172. 5179. 1172.6184.8168. 3182.8170. 3167. 5171.2170.4166. 9178.5164. 1169. 51

4、73.4170. 3数据格式如下:X1164.42175.53171. 74171.8|5172.26176.47164. 38169. 99175.810168. 311168.812170. 3|13169.214170. 315168.816174.917172.818168.4|19166.920172. 121171. 122177. 123177.624167. 525174. 726172. 327171.82818029178.6|3017131176.432170.433174.834172. 535175.2|36171. 23717538168.239174. 54017

5、3. 541172|42169. 143164.244174.845172. 746166. 347171. 548170.44916550166. 751171. 752178. 153182.554166. 955177.256172. 157169.458175. 159172.560166. 961162.862171. 763172.764169. 76517266181. 167168. 368164.469178.270174.471179. 172178. 573170. 274166. 875166. 376176. 177173. 578170.479177.880170.

6、 581174. 182162. 383172.684164. 185160. 186171.68717488181. 389166. 390165.2911739216593177.294171. 31 95 1184.896 |169.597170.998165.299169100173.8101176. 1102168103167.4104172.8105170106177107168. 3108 |173.4109170. 1110172111174.5112164.7113169.2|114 |172.4115173.2116166.8117172.7118163.5119182.8

7、j 120 1170. 3为制作频数表,键入Stata命令:.gen f=in t (x-160)/2) *2+160产生用以作频数表的新变量“ f ”,tab f对变量“ f ”作频数表“ge n”命令产生新变量“ f ”,将各观察值转换成相应该组的下限值。int 为取整函数,结果为括号内函数值的整数部分,如int(3.24)=3 o “ 160”为第一组的下限,“ 2 ”为组距。以第一例观察值160.1cm为例,f=int(160. 1- 160)/2)*2+160=160,则它应归入 “1606” 组。结果如下:f Freq. Perce nt Cum160 |10. 830. 8316

8、2 |32. 503. 33164 |108. 3311.67166119. 1720. 83168 |1613. 3334. 17170 |2218. 3352.50172 |2218. 3370. 83174 |1411.6782.50176108. 3390. 83178 |54. 1795. 0018032.5097. 50182 |21.6799. 17184 |10. 83100. 00+Total |120100. 00作频数图hist f, start(160) width(2)结果如下:I 含I2 午.0 -IIIIiI6i 57 8例2-2某医生测定230名正常成年男子的空

9、腹血清胰岛素样生长因子-1(IGF-1F)水平,整理后编制为频数分布表(表2-2 ),请根据该频数分布表作频数图。表2-2 230名正常人空腹血清胰岛素样生长因子水平中位数的计算IGF-1F(1)人数f频率(%) (3)累计频数f(A累计频率()(5) = ( 4) / n503013.043013.01507130. 8710143.92504921. 3015065.23502812. 1717877.4450、146. 0919283.5550125. 2220488. 7650104. 3521493.075083.4822296.585052. 1722798.7950105031.

10、 30230100.0合计230100. 00Stata数据格式如下:Xf150302150713250494350285450146550127650108750898505109503tab x weight二f制作汇总表的频数表tab x weight=f制作汇总表的频数表在本例中,x的取值为各组的下限,而f是各组的频数,所以需要用Stata制作频数图的频数选项weight=。结果:x IFreq. +Perce ntCum.3013.0413. 04150 |7130. 8743.912504921. 3065. 22350 |2812. 1777. 39450 |146. 0983.

11、 48550 |125. 2288. 70650 |104. 3593. 04750 |83. 4896. 52850 |52. 1798.7095031. 30100. 00hist x weight=f, start(50) width(100)Total 230100.00制作频数图hist x weight=f, start(50) width(100)amol /L例2-3随机测量某地10名2030岁健康男性居民血清铁含量(),测量值分别为 6. 58 , 7. 42 , 15.32 , 15. 78 , 17.60 , 17. 98 , 15.21 , 17. 53 , 20. 1

12、1 , 22. 64,试求其平均血清铁含量。Stata数据为X16. 5827.42315. 32415. 78517.6617. 98715.21817. 53920. 111022. 64SU X计算均数标准差结果:VariableOb s+Me a n Std. Dev.MinMaxX 11015.6175.0752546.5822.64所以平均平均血清铁含量为15. 617例2-4计算例2-1的频数表(表2-3 )中120名男子的平均身高显然,如果用Stata,对于例2-1的资料不需要事先转化为频数表,然后再计算均数。不妨用例2-2作为例子展示Stata计算频数表资料的均数。su x

13、weight=f计算频数表资料的均数结果:Variable+ObsWeightMea n Std. Dev.MinMaxX 110230290223.412350950例2-5 8名麻疹易感儿接种麻疹疫苗3周后,其血凝抑制抗体滴度分别为1:4, 1:8, 1:16, 1:32, 1:64, 1:128, 1:256, 1:512。试求其平均抗体滴度。数据格式:316432564612872568gen logx=log(x)计算X的自然对数su logx计算自然对数的均数,得到3.81231disp exp(3. 81231)计算均数的反对数,即指数得到几何均数为45. 254857另外,St

14、ata还有一个直接计算几何均数的命令:mea ns x结果为:Variable Type Obs Mea n 95% Con f. I ntervalXArithmetic8127.5-20.53203275.532Geometric845. 2548310. 94481 187. 1206Harm on ic816. 06275 Mi ssi ng values in con fide nee in terval (s) for harm onic me a n in dicate that con fide nee in terval isun defi ned for corresp o

15、nding variable(s). Con suit Refere nee Man ual for details.Means命令计算算术均数、几何均数以及调和均数,其中几何均数为 45.25483,和前面的结果相同。例2-6某地区50名麻疹易感儿童接种麻疹疫苗3周后,测其血凝抑制抗体滴度,如表2-4中第(1)栏和第(2)栏,求平均抗体滴度。表2-4 50名麻疹易感儿童平均抗体滴度计算表抗体滴度(1)人数f(2)滴度倒数X (3)1g X (4)fig X(5) = ( 2)X( 4)1:4140. 60210. 60211:8280. 90311. 80621:166161.20417.

16、22461:3210321. 505115. 05101:6416641. 806228. 89921:12881282. 107216. 85761:25652562. 408212. 04101:51225122. 70935.4186合计5087. 9003数据如下:x1231643256461281016256512gen logx=log(x)计算X的自然对数su logx weight二f)计算自然对数的均数,得到 4. 04798disp exp (4. 04798)计算均数的反对数,即指数得到几何均数为57.2816312也可以用mea ns x weight=f结果:(an

17、alytic weights assumed)Variable Type ObsMea n95% Co nf. In tervalx I Arithmetic 895.76-2. 30755 193. 8275Geometric 857.281622.59723 145.2029Harmo nic 8 32.82051.Missi ng values in con fide nee in terval (s) for harm onic mea n in dicate that con fide nee in terval is un defi ned for corresp ending v

18、ariable(s). Con suit Refere nee Man ual for details.例2-7 5名成年男子的体重(kg)为60, 70, 75, 80, 90,求中位数。例2-8某医生测定了 6名正常成年男子的空腹血清胰岛素样生长因子-1(IGF-1F )水平为 150, 170, 185, 245, 265, 280,求中位数。注:这两个例子用软件算实在是浪费,可以用Isu x, detail来处理。对于 summary加上detail后可以输出百分位数,其中的P50就是中位数。PercentilesSmallest1%60605%607010%6075Obs525%70

19、80Sum of Wgt.550%75Mea n75LargestStd. Dev.11. 1803475%807090%9075Varia nee12595%9080Skew ness099%9090Kurtosis2. 05例2-9 8名7岁男孩的身高(cm)分别为H6, 118, 119, 120, 121, 123,125, 126o请计算这8名7岁男孩身高的第25百分位数和第90百分位数。Stata数据为:119Stata命令为:su x, d结果为:ntilesSmallest1%1161165%11611810%116119Obs825%118.5120Sum of Wgt.50%120.5Mea n121LargestStd. Dev.3. 46410275%12412190%126123Varia nee95%126125Skewness. 1322699%126126Kurtosis1.836735Perce812第25百分位数和第90百分位数分别是118. 5和126例2-10分别依据例2-1中身高的原始资料和频数表(表2-3)资料计算标准差。Stata命令为:结果为:Variable | Obs Mean Std. Dev. Min Maxx |120 171.60254.690084160.1184.8标准差为4. 69

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1