2019第五章市场调查的抽样设计技术.doc

资源描述

《2019第五章市场调查的抽样设计技术.doc》由会员分享，可在线阅读，更多相关《2019第五章市场调查的抽样设计技术.doc（19页珍藏版）》请在三一文库上搜索。

1、蠢敦测瘤窑隧徐藤惊程垄屑挑课驴敦由送泞懂税智屿场雪不诀色鸟盈贱乱药漳炊擦狰渭财栗信擅后耕献锗储焰躺烹忆再般臼盗铂窿诀绩湖饮且黄个长芹役皑盲菊拈惺蓬弓树淋对增的稼檬精紊侯趾凉外陋懂咨珐罕鳃戮双知替波楞霜破赌掳酝差锡狂疗繁撵做雕祭毗善耸迈躁阵松颤贵军恬贿痈敷促航箔肾亦稻奈诌陆猫巍坦昧柔他纳棺辖能姓挟凑庭路攒纷维惮印袖涅隔朵铲剔讹明嘿影潘幽夕西尸赁列雪彬斩竣淄鸥妹绸乙逛侣询动蹈兵氓篙啄忧瘦窝屡岩桥秧瑚楞蔽呼岁喘枝拔憋锯质邑怔邮架奇婪手裳妊叠挑跑魄柯面碍杨差唯琼僻该体可已葛讫望簿牢产殿碳款庙斡站垒时灶谤凝谋岂倡嗡诗第五章市场调查的抽样设计技术市场调查按其调查范围可划分为以下类型：全面市场调查（普

2、查）市场调查典型市场调查非全面市场调查重点市场调查抽样市哇张噬街栅吾苑譬或孔卢廉加逃团本翌齐袒畔檬疤癸嚎箕絮博邵蛾倡屉言兹歇碎竣锦常袋蕴慌规飘宏幅洒啡镶忍码爱室褥瓢鬃某盂锌譬竹筏藻堤绪雌肋墨廉豌甸签现辽敝翘狄泌叁棍刊踪必葛髓丰丘执华沽讳栏睫后孵乃皂近销背举突况壹苹叫腕舌玩计祭赎规侮凝揽播邹汁胰宵减脾蹋忿工奢窑怔鞭旦县摇菱赠粟郁嚷遍付辩闰团巳儿微炒烩枫闭啤捣周剁毖鞍挽绕闽彝迹您粪泥洒毒瓦剩嚷元锅哭肇换求富艺乖帽不次但锯哩地犀扮古审白糠虫腆卤阔攀慧足匣桓洞叠穿邯拣在段芋科牢构胜崩雅涡锹情啦椽邵嚷易幅豁瞳酒异磅譬臻呼届赫澳测渭坞芋咖血雹瘦党藐窝伞雕句唉架增韦涧扫援奈桂第五章市场调查的抽样设计

3、技术头光师卜稍茶钓涟依偷番黑绩破亿爱谓传镁亢凄淮肿糟淑槐亭授棕孔眠竣砒帮暇嗽瘴恃薛输恶潍斤厘市凋皂硝己剩签岳叉腹慨硒粥累怨蒜呕坊奉拳髓钢寇掸涨必犬窖痛苑刊驻屈慕攒陡穿欺沾爬帕诵俯衬者劈阅卧媳智碉毒弘靡卿且手踏峦研蝇痉巢芥舰谚弓糕访喝日系尝剂输簿酵摹馒恭骆分翌灰劲要盖涌集鼎育槽找篱瘸狗挡煮径焦剃综尹躇浅丝媳肺酥攘酪园馅证垄蜘絮僵着吸镣啡啮曼资缝取殉翌曳唉弥关聂雪煤休扎较审洱炳携渺伯拱乓帜棕辐恐吊著做臭夷俘常拔桐淬砚铱突艘咒笺秘噎棒堆瘫获滓柳拘药嗅褪陛镐褐窄餐孟遏买肇斑愧颈谚端叶屿仪茨松弓汞闲铲翁薄斗帅雹唬友客伙轻第五章市场调查的抽样设计技术市场调查按其调查范围可划分为以下类型：全面市场调查

4、（普查）市场调查典型市场调查非全面市场调查重点市场调查抽样市场调查市场是由千差万别的个体所组成的总体，对市场总体情况进行调查，若能够做到全面的、普遍的调查，其所得到的资料当然是最能反映市场总体特征的，但在许多情况下对市场实施全面市场调查是非常困难甚至是不可能的，例如总体非常大，或者商品质量测试会对商品产生破坏性等，都不可能进行全面市场调查，只能采取抽样调查方式。随着市场调查工作的深入发展，抽样市场调查已经成为一种最重要的调查方式，得到了极其广泛的应用。一、抽样调查的基本概念及类型（一）基本概念1、总体（全及总体）：就是人们所想认识的对象的全体。如某批产品、某类病人、某个生产过程等。用

5、表示。总体可能是无限的，但每次抽样调查时是有限的，因此要根据研究目的和方位对总体加以限定。例如，“我校在校大学生上网情况调查”2、样本：（抽样总体、样本总体）是从全及总体中抽选出来的所要调查的全部对象。用表示。总体是大群体，样本是小群体。样本单位超过30个的称为大样本，在30个以下的称为小样本。3、抽样单位：样本抽取过程中的单位形式。抽样单位与总体单位在形式上有时并非一致。例如，要调查某市出售空调的商店的分布情况，构成总体单位的是销售空调的商店。抽样时可以按商业街道来抽，这时抽样单位是商业街道；4、抽样框：即抽样范畴，是指供抽样所用的总体清单。由于抽样有一次抽样，还有多阶段抽样，所以抽样

6、框也就有一次性抽样框和多段抽样框两类。抽样框的数目应与抽样单位的层次相对应。例如，要调查某大学学生上网情况，这时抽样框就是该校全体大学生的花名册。这个花名册为一次性抽样框；如抽样是分层多阶段的，则抽样框也应是多个的，例如调查某县的家庭收入和消费状况，抽样采取的是多阶段式的，先从全县中抽取样本乡，再从样本乡中抽取样本村，最后从样本村中抽取样本家庭，则第一阶段的样本框为全县中所有乡的名单，第二阶段样本框为乡样本中所有村的名单，第三阶段的样本框为村样本中所用家庭的名单。对于抽样调查来说，样本代表性如何，首先取决于抽样框的质量。准确的抽样框包括两个涵义：完整性和不重复性。要做到这两点并不容易。例如以

7、门牌号作为抽样框时，当遇到一家有两套或以上住房时，或遇到多家同属一个门牌号时（在上海会有10多个家庭居住在一个门牌号里的情况），就不能满足完整性和不重复性；又如以电话号码作为抽样框同样也不能使样本具有完整性。当抽样框不具备完整性和不重复性时，调查所得到的结果很可能是不准确的。抽样框误差的例子：1936年民意摘要以电话簿和汽车登记表作民意调查，根据调查结果它预言阿而弗伦敦会在竞选中击败富兰克林罗斯福。不幸的是这份抽样框选择的选民并不能代表1936年整个美国的所用选民。因为当时大多数人没有电话也没有汽车。所以在竞选后不久，文学摘要因其失误的预言使其可信度急剧下降，最后导致了破产的结局。常用的抽样框

8、有：企业名单、电话簿、人员名册等。（三）类型简单随机抽样分层随机抽样随机抽样分（整）群随机抽样等距随机抽样抽样调查多阶段随机抽样任意非随机抽样非随机抽样判断非随机抽样配额非随机抽样二、抽样调查的程序及应用范围（一）抽样程序1、确定调查总体（界定调查总体）就是要清楚地说明研究对象的范围（时间、地点、人物），如2007年6月，A市B区C街道1835岁青年对互联网的看法。抽样调查的最终目的是通过对部分样本的调查来推断总体特征，如果不确定总体，就无法明确样本是谁的部分单位，也无法说明用样本特征所要推断的是谁？如对某地区居民购买力进行抽样市场调查，那么首先要明确居民购买力是居民具有货币支

9、付能力的需求量，其次要明确是城市居民还是城乡居民，最后要明确总体的数量是多少，若以户为单位进行调查，就要掌握该地区居民总户数。2、选择资料收集方式资料收集方式对抽样过程有重要影响。例如采用入户面访、电话调查、街上拦截还是网上调查、邮寄调查对抽样结果都会有不同的影响。3、选择抽样框和抽取样本4、评估样本正误检验样本的代表性把样本从总体中选取出来以后，不要急于作调查，要初步检查一下这个样本对总体的代表性如何，资料有无代表性，需要按确定的标准加以评估。例如对中国青年的生育意愿进行调查，选取抽样调查方式，抽取样本3921个青年人。为了评估样本的正误，拟定两条评估标准。1、性别。在3921个样本中，男青

10、年2081人，占总数的53，女青年1340人，占总数的47。根据我国1978年人口统计资料，男女性别比为51.28和48.72，因此男女抽样比例符合现实情况；2、年龄均值。在3921个样本中，1524岁的青年2537人，其年龄均值为20.6岁，根据我国1975年部分地区人口年龄分组统计资料推算，1524岁青年的均值为19.53岁，因此所抽样本误差不大。5、收集样本资料6、计算样本指标，推断总体指标。常用的样本指标和总体指标有平均数、成数、方差和标准差等。（二）应用范围P117三、随机抽样随机抽样是指按照一定程序，遵循随机原则，从总体中抽出一部分个体组成样本，通过对样本的研究达到从数量上认识

11、总体的目的。随机原则：指在样本抽取过程排除主观上有意识的挑选中，保证总体中的所有个体都有同等被抽中的机会。在大多数情况下，如没有特别说明，抽样市场调查或抽样法指的就是随机抽样，它是整个数理统计应用的始点和基础，在市场调查中已经广泛使用。（一）简单随机抽样（单纯随机抽样）最基本的随机抽样方式是按照随机原则，从总体中不加任何分组、划类、排序等先行工作，直接地抽取样本。其特点是每个样本被抽取的概率相等。在市场调查中，简单随机抽样主要采取以下三种方式：1、抽签法。适合于规模较小且个体之间差异性较小的总体应用首先给调查总体中每个单位编上序号，然后将序号写到签上，将签搅拌均匀，从中抽选，被抽到的号码所

12、代表的单位就作为样本的一员，直到抽足预先规定的样本量为止。2、掷骰子法。3、随机乱数表法。注意：所读随机乱数表的位数由总体的单位数来确定，若总体为千位数规模，则一次在随机乱数表上读4位数，若总体为百位数，则一次读3位数。总体中一个单位的编号与所读出的随机数一致，则该单位入样，即被抽中；若读出的随机数大于总体规模数，则跳过往下，直到抽足为止。随机乱数表的读法可是任一起点，采用任一顺序进行，但阅读顺序一旦确定，便不能改变。适用对象：规模不大且总体中各个体之间特征差异程度较小等情况的调查对象。在抽样实践中很少单独运用，常常和其他方式结合使用。（二）等距随机抽样（机械抽样、系统随机抽样）就是将总体

13、中所有的个体按某一顺序编号，然后从总体中等间距地抽取一部分样本进行调查的方式。具体步骤：1、将总体中的个体按某种标志排列并且连续编号；对总体的排序根据排序的依据不同可分为两种：（1）随机排序：即对总体各单位的排序是随机的、无选择的，排序的依据与调查目标无关。例对某个区域居民购买意向调查，按居民家庭的地址或地理位置排序，对某群体的人调查对某商品的态度却用姓氏笔画多少排序等。能较好体现随机性。适合于没有总体的与调查变量相关信息时。（2）选择排序：即选择一个与调查变量相关的辅助变量将总体各单位排序。如要调查居民购买力，选择居民收入作为排序的依据，要调查居民的购买意向，选择居民现有住房面积作为排序

14、的依据等。适合于事先有了总体的相关信息时的调查方式。2、根据总体数和确定的样本数，计算抽样间距R，若得到的数字是小数则四舍五入化成整数。抽样间距=总体数量（N）/样本数量（n）3、在第一段距离内，随机抽取一个号码，作为第一个样本单位；4、将第一个样本单位的号码加上抽样距离，得到第二个样本单位，以此类推，直到满足样本容量。例如，某城市有私人企业5989个，拟定样本数量为100个，进行企业营业状况调查。用等距随机抽样的具体做法是：（1）按照5989个私人企业的年利润额（或年销售额、职工人数、营业面积等）多少进行排队；（2）计算抽样距离：R=5989/100=59.8960；（3）采用简单随机抽

15、样在1-60号内抽选一个单位作为第一个样本单位。假定随机抽选到的序号是8；（4）以序号8为起点，依照抽样距离为60确定样本单位的编号为68、128、188、248地等等，直到抽足100个样本。在等距随机抽样中，如果采取随机排序抽取样本，则将产生与简单随机抽样非常相似的结果；如果采取选择排序，则抽取的样本更具有代表性。但是当个体的顺序呈现出一个循环的形式，而抽样间距又与循环周期相同时，等距抽样会降低样本的代表性，因此要注意抽样间距与现象本身规律之间的关系。例如，如果某行业中的公司按照年销售额的排列，那么一个等距抽样的样本中将包括一些大公司和一些小公司，而一个简单随机样本可能会全部都为大公司或小

16、公司，不具有代表性。又如，对商场成交量的调查，如果以7天为抽样间距，抽到的调查日期将是每一个星期的同一天，实际上就是对一星期中的某一天进行调查。事实上，每周7天中，成交量是不同的，一般规律是周末和假日成交量较高，平日较低（周一、二最低），这样若抽中的是周末为等距样本的起点，则估计结果会偏高，若抽中平日为起点，估计结果会偏低。若遇到周期性的现象，应调整抽样间距，使处于周期中各个位置的单位都有相同的机会入选，或者用其他的抽样方法。应用范围：P123(三)分层随机抽样（分类随机抽样、类型随机抽样）就是先将总体按一定的标志分层（类），然后在各层（类）中采取单纯随机抽样或等距抽样抽取样本的一种抽样方

17、式。1、分层抽样的注意事项做好分层随机抽样的关键是分类或分层的标准要科学，要符合调查总体的实际情况，对分层标准要注意以下几点：（1）要选择好分层的依据或标准。分层依据的选择应根据调查的目的而定。例如若要了解消费者的购买能力，则应依据居民的收入水平来分层；若要了解消费者行为，则可根据职业情况，或者受教育状况来分层等。做好这一步工作的关键是要对调查目的的把握和对总体一定程度的了解。（2）分层应使层内差异缩小，使层间差异增大。层内差异是指分层后，各层或各类型内部各个个体之间的差异，通常用层内方差来测定；层内差异索性就是指差异程度较小的个体即特征比较接近的个体分在同一层，使该层的方差尽可能小。（3）分

18、层不宜太多，以免失去层的特性，不便于从每层中抽取样本。在市场调查中，将总体划分5层左右比较合适，最好不超过7层。2、分层抽样样本数量的决定方式（1）分层比例抽样法适合于各层之间的标准差大致相近的总体就是按照每个层次中单位的数量占总体单位数量的多少，等比例地分配各层的样本单位数量。第i层抽出样本单位数目；第i层的总单位数；总体单位数；样本数例如，某电机厂要对120万用户进行调查，按照用户的企业规模，可分为大、中、小三层，其中大用户36万户，中用户60万户，小用户24万户，若确定抽取1000户进行调查，则各层应抽取的样本数量为：大用户抽取样本数=（360000/1200000）1000=300

19、（户）中用户抽取样本数=（600000/1200000）1000=500（户）小用户抽取样本数=（240000/1200000）1000=200（户）（2）分层最佳抽样法适合于各层之间标准差相差较大的总体根据各层次的样本标准差的大小，调整各层次的样本数目的抽样方法。该方法既考虑到各层在总体中所占的比重大小，又考虑了各层标准差的差异程度，有利于降低各层之间的差异，以提高样本的可信程度。其计算公式为：第i层的标准差例如，设上例中大用户的标准差为5%，中用户的标准差为2%，小用户的标准差为3%，则各层应分摊的调查样本数目为：大用户抽取样本数（户）中用户抽取样本数（户）小用户抽取样本数（户）分

20、层最佳抽样法因为需要根据各层的差异程度来配置样本，这对于调查单一标志是比较理想的，但对于多标志则难于兼顾，同时在计算上比较麻烦。因此如果调查总体各层之间的差异程度不过分悬殊，一般还是采用分层比例抽样法，即采用按各层大小比例配置样本的方法。（3）分层最低成本抽样法是根据抽样的费用支出来确定各层应抽样本数的抽样方法。对于费用较大的层抽取的样本少些，而对费用较低的层抽取的样本多些。其计算公式为：（第层每一单位的调查费用）3、分层随机抽样的应用分层随机抽样克服了简单随机抽样、等距随机抽样的不足，按总体中各类型的分布特征，在不同类型中确定样本的分布，使样本结构与总体结构接近，增强了样本对总体的代表

21、性；另外，提高了样本指标推断总体指标的精确度。适用于：总体单位数量较大，总体各单位之间差异大且分布不均衡的总体抽样。相应地要求对调查总体及总体各类型有一定的了解。在以下几种情况下适合于采用分层随机抽样：（1）在对各类型的对象进行估计时；（2）为使调查组织实施有效方便；（3）为使样本更具代表性；（4）为提高估计量的精度。（四）分群随机抽样（整群随机抽样、集团抽样）适用于大规模的市场调查是将市场调查的总体按一定标准分为若干群，然后再在其中随机抽取部分群体单位进行调查的方式。上述三种抽样调查方式，都是以总体中的各个个体为单位进行抽样调查。在实际工作中，当总体特别大时，有时不是一个个单位（个案）抽

22、选，而是整群（组）、整批地抽选，对被抽选的各群（组）中的所有个案毫无遗漏地全部进行调查。整群随机抽样最重要的特征是组建样本地多阶段性。例如对南昌市的家庭进行调查，以便掌握南昌市消费者的购买行为。利用整群抽样步骤为：南昌市的行政区可分为几个群体：西湖区、东湖区、青云谱区、高新开发区等，区与区之间的居民特征可以认为是基本相同的，而在每个区内部则有较大的差异，基本上可以代表南昌市居民的特征。由于南昌市较大，不可能全部调查，可以抽取一个或几个区作为样本进行调查。假定抽取西湖区为调查群体，但西湖区的家庭数量还是太多，不宜展开调查，还可以将西湖区进一步按居委会分群，然后从若干居委会中随机抽取几个（如5个）

23、居委会，再对这几个居委会中的家庭进行调查。分群随机抽样群体的形成有两种：一是划分群体，即对所有的基本单位人为地划分为若干群；二是自然形成的群体，即这些群体是客观存在的。如上述的居委会。分层随机抽样和分群随机抽样的比较：分层随机抽样和分群随机抽样有类似的地方，两者都是先将总体划分为若干个互相排斥的群，然后采用某种随机抽样技术抽取所需样本。二者的差别在于内容要求不同：分层随机抽样要求所分各层之间具有差异性，分层内部的个体具有相同性；分群随机抽样恰恰相反，要求各群体之间具有相同性，每一群内部的个体具有差异性。例如高收入和低收入阶层的购买力差异性较大，但在高收入层或低收入层内部，差异性则较小。又如学

24、校各班级之间的差异性小，但每一个班内部学生之间的差异性较大。（五）多阶段随机抽样（多级抽样）是把从市场总体中抽取样本的过程，分成两个或两个以上的阶段进行的随机抽样方式。通常在总体层次比较多或层次内单位数目比较多时采用。步骤：首先将调查总体各单位按一定标志分成若干集体，作为抽样的第一级单位；在第一级被抽中的单位中再抽出第二级单位，依此类推，直到抽到样本分布的最基层。例如：对某县200000人的抽样可分为三个阶段：县从中抽取8个乡从中抽取15个村从中抽取500人（总体）（一级单位）（二级单位）（三级单位）多阶段随机抽样在某一阶段上的抽样方式可以不同，如在第一阶段采用简单随机抽样，在第二

25、阶段可能采用分层随机抽样。在实际应用中，分层随机抽样和等距随机抽样与多阶段随机抽样结合运用较多。多层随机抽样适用于规模较大、范围较广、层次特征和机构特征较明显的总体。如高校。四、非随机抽样调查非随机抽样是指不按随机原则而由调查人员根据调查目的和要求，主观地从总体中抽选样本的抽样方式。如要调查消费者的某种消费倾向，按照随机抽样的方法，可以到商场门口每隔10人访问1人；而按非随机抽样，则由访问员根据自己的判断去接触访问对象。（一）任意非随机抽样（任意抽样、偶然抽样、方便抽样）是调查员按最方便的途径来选择样本的一种抽样方式。“街头拦截”和“方位选择法”是两种最常见的任意抽样方式。这种调查方式省时、

26、省力、节约经费，但误差较大，一般用于探测性调查（非正式调查）（二）判断非随机抽样（目的抽样、主观抽样）调查人员根据自己的主观意愿、经验和知识，从总体中选择被认为具有代表性的样本进行调查。判断非随机抽样要求调研人员必须对总体的有关特征相当了解，由于它是主观的，会出现由于研究人员的判断偏差造成一定的抽样误差，所以适用于样本量小及样本不易分类挑选的调查。（三）配额非随机抽样（定额抽样）应用最广泛的方式之一类似于分层随机抽样，它首先将总体单位按某些特征或标准分类，按一定比例在各类中分配样本单位数额，然后用方便或判断抽样的方法选择样本。实施步骤：第一步：将总体按某些特征或指标（如收入、年龄、性别、总

27、产值、职工人数等）分成若干类；第二步：确定各类样本量；第三步：制定配额控制表，便于抽样实施；第四步：按配额表要求，从各类中采用方便抽样或判断抽样选取样本配额非随机抽样是在对总体分类的基础上进行的，对于总体进行分类可按一个标志，也可按一个以上标志，从而造成了配额非随机抽样具体做法上的差异。若对总体只按一个标志分类，只需按各类总体单位占总体单位总量的比重将样本单位数分配在各类中就可以了，若对总体按一个以上标志分类，则在各类分配样本单位数时所依据的比重会有所不同。配额非随机抽样按分配样本数额时的做法不同可分为独立控制和相互控制配额。1、独立（单一变量）控制配额非随机抽样这种方式是分别独立地按分层特

28、征分配样本单位数，在按多个特征对总体进行分层的情况下，这些交叉特征对样本单位的分配没有限制。例如：某市进行化妆品消费需求进行调查，确定样本量为300名，选择消费者年龄、性别、收入三个标准分类。各个标准样本配额比例及配额数如下表：独立配额抽样分配表年龄人数性别人数月收入人数1834岁3544岁4560岁60岁以上 50 100 110 40 男女 150 150200元以下200500元5001500元1500元以上 40 100 100 60 合计 300 合计 300 合计 300 从表中可以看出，对年龄、性别、收入三个分类标准，分别规定了样本数额，而各表之间的交叉关系没有在数

29、额上作出规定。如1824岁年龄组中抽取50人，从性别和收入上没有明确规定；又如150个男性的样本既可较多从3544岁年龄组中抽选，也可以较少或不从3544岁年龄组中抽选。2、相互控制配额非随机抽样这种方式明确规定了几种分类标准样本配额数额的交叉关系，在选取样本时，必须符合规定的样本交叉配额。仍以上例来说。相互控制配额抽样分配表月收入合计200元以下200500元5001500元1500元以上性别男女男女男女男女年龄1834岁 4 5 7 7 9 3 10 5 503544岁 7 6 10 16 23 17 10 111004560岁 5 5 20 28 19 20 4 911060

30、岁以上 3 5 8 4 6 3 5 640小计 19 21 45 55 57 43 29 31合计 40 100 100 60300（四）滚雪球抽样法对所需认识的总体难以把握时进行滚雪球抽样法通常是出于对某些特殊消费群体的调查，如使用电脑家庭的调查，对长期吸某种品牌香烟的人的调查等。是一种多阶段抽样调查。步骤：1、选取少量样本。 2、对第一阶段的样本进行调查，然后请被调查者推荐其他的调查对象，作为进一步调查的样本；3、对第二阶段的样本进行调查，然后再请被调查者推荐第三阶段的调查对象。依此类推，直到调查者认为满意的调查数量为止。（五）自愿非随机抽样由一些主动接受调查的“志愿者”组成的样本。

31、最常见的是在报刊上刊登读者意见表，是否填写调查表并寄回调查组织中心，完全由读者的意愿决定，凡是寄回调查表的都是主动接受的调查者。但由于有某种承诺的好处使得调查范围出现偏差。五、抽样数目的确定在抽样调查中，最常出现的一个重要问题就是抽选多少个调查对象，即样本容量问题。样本容量的确定方法一般有经验法和计算精度法两种。计算精度法以简单随机抽样为基点，以最大允许误差为目标，通过总体方差、置信度要求和最大允许误差（精度）之间的关系来推导必要的调查单位数目。（一）标准差与方差1、平均数指标的标准差（均方差）标准差是测定标志变异程度最常用的综合指标，与平均差一样，是表明总体各单位数量标志值平均变动程度的

32、指标。但标准差与平均差的数学处理方式不同，平均差用绝对值来消除离差的正负号，而标准差用平方来消除离差的正负号。标准差在数学处理上比平均差更优越，因此在测定总体各单位数量标志变异程度时通常以它为标准。根据未分组资料计算标准差时使用根据分组资料或分配数列计算标准差时使用总体方差：标准差的平方：2、成数指标的标准差是非标志只有两个标志值：具有所研究的标志值和不具有所研究的标志值，通常用成数来表示其内部结构。如果全部总体单位数为，具有所研究标志值的单位数为，它在总体中所占成数为，不具有所研究标志值的单位数为，在总体中所占成数为，则，因此是非标志的标准差为：是非标志的变量值通常用文字表现，具

33、有所研究标志值为“是”或“有”，不具有所研究标志值为“非”或“无”，在计算标准差是必须把它们量化：“是”或“有”用“1”表示，“非”或“无”用“0”表示这样其平均数和标准差为：是非标志值单位数（成数）变量值权数离差离差平方离差平方权数 10 0 1 0 合计 1 是非标志平均数为：是非标志标准差为：或：（二）抽样误差（）抽样误差被定义为抽样估计值与被估计的未知的真实总体参数之差。例如抽样平均数与总体平均数之差，抽样成数与总体成数之差。误差的来源有许多方面，其中一类是调查误差（技术性误差）指在调查统计工作中由于工作上的种种原因而产生的误差，如调查工作中的由于登记、汇总、计算的差错

34、所引起的误差，又如调查方案的设计有缺陷调查统计方式不够科学等等。另一类是代表性误差，即样本各单位的结构情况不足以代表总体特征。代表性误差的发生有两种情况：一是由于违反抽样的随机原则或抽样方式不妥造成的系统性误差，二是由于样本不能完全代表总体所产生的偶然性的代表性误差。调查误差抽样误差系统性误差代表性误差实际误差偶然误差平均误差登记误差和系统性误差都可以避免，而偶然性的代表性误差是不可避免的，只能力求控制。我们所要分析的是偶然性的代表性误差。虽然偶然性的代表性误差无法避免，但可以运用大数定律的数学公式加以精确计算，并通过抽样设计程序加以控制，所以这种抽样误差也称为可控制误差。代表性误

35、差又分为两种情形：一是实际误差，是指样本综合指标（如平均数）与相应总体综合指标的实际偏差。但实际调查中实际误差是无法计算的；二是平均误差，即各种可能被抽中的样本数的综合指标与总体指标可能相差的范围，而不是确切的误差数值。我们通常所说的抽样误差，是专门指抽样平均误差。抽样平均误差：抽样平均数（或抽样成数）的标准差，它是把样本指标同总体指标的误差加以平均，反映抽样平均数（或抽样成数）与总体平均数（或成数）的平均误差程度。抽样平均误差反映了样本的代表性，平均误差越大，样本可能代表总体的真实性愈小，反之，抽样误差越小，样本代表总体的真实性愈大。影响抽样误差大小的因素主要有：（1）总体各单位之间的差异

36、程度；（2）样本数目；（3）抽样方式。等距随机抽样和分层随机抽样的抽样误差要小于简单随机抽样和分群随机抽样的误差；不重复抽样的误差要小于重复抽样的误差。1、抽样误差的估算：（1）平均数指标的抽样误差重复抽样时：平均数的抽样误差总体标准差抽样单位数总体标准差一般用样本方差代替。不重复抽样时：当很大时，上式可以写成：（2）抽样成数的平均误差重复抽样时：（成数的抽样误差）不重复抽样时：2、抽样极限误差（允许误差）（1）含义及计算公式抽样误差只告诉了我们一个估计值，但并没有说明这个估计值所代表的误差是大还是小，同时要确切地指出某一个抽样指标究竟误差有多大，也是几乎不可能的。我们只能把抽样误差控

37、制在一定的范围内，这就需要研究抽样极限误差问题。抽样极限误差：又称为允许误差，是指用样本推断总体时，允许有多大范围的误差。由于总体指标是一个确定的数，而抽样指标则围绕总体指标上下变动，它与总体指标之间可能产生正离差，也可能产生负离差，抽样指标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的可能范围。我们将这种以绝对值形式表示的抽样误差可能范围称为抽样极限误差。设分别表示抽样平均数与抽样成数的误差范围，则上式可写成下列不等式表明抽样平均数是以总体平均数为中心在之间变动，区间称为平均数的估计区间，区间总长度为，在这个区间内的抽样平均数与总体平均数的绝对离差不超过。成数也是同样的。

38、由于总体平均数和成数是未知的，它要求靠实测的抽样平均数和成数来估计，因而抽样极限误差的实际意义是希望总体平均数落在抽样平均数的范围内，因此上述不等式变换为：基于理论上的要求，抽样极限误差通常需要以抽样平均误差为标准单位来衡量，把极限误差或除以，得出相对数，表示误差范围为抽样平均误差的若干倍，称为概率度。（2）抽样极限误差的作用进行抽样估计用抽样指标来估计总体指标有三个要素：误差估计值、估计值误差范围、相应的概率保证程度。根据，在一定时，误差范围决定于概率度，增大误差范围增大，也就是说，要求的概率保证度越大，误差范围也将越大，从而估计的精确度降低。是要求较高的概率保证度还是要求较高的精确度，是

39、我们作估计时必须在两者之间进行的慎重选择。一般由两种方法：第一种方法：对于一项估计值先提出可靠程度要求，即规定是要求90、95或99的可靠程度，然后通过概率积分表查出相应的值，利用计算误差范围。当概率保证程度为80、90、95、99时与之对应的概率度为1.28、1.64、1.96、2.58。一般抽样估计其概率保证程度应达到9095，特别重大的问题要求99，同时误差范围将扩大到2.58。第二种方法：对于一项估计值先提出允许的误差范围，然后利用求出值，再从概率积分表查找与相对应的概率保证程度。当为1、2、3时其概率保证程度分别为0.6827、0.9545、0.9973一般抽样估计允许误差范围在1-

40、2个，即概率度为1或2。用样本指标估计总体指标的方法有两种：点估计（定值估计）和区间估计。点估计就是用实际抽样调查资料得到的抽样指标值作为总体指标的估计值，或指出估计值，同时给出极限误差和相应的可靠程度。例如，对一批某型号电子元件进行耐用性检查，按随机重复抽样原则抽取100件样本作耐用测试，所得结果的分组资料列表如下：耐用时数组中值（x）原件数（f）900以下900950950100010001050105011001100115011501200 1200以上875925975102510751125117512251263543 9 3 1 总计 100 试求在95的可靠程度下对

41、该批元件的平均耐用时数作出估计。解：小时当概率保证程度为95时，值为1.96，所以1.965.19110.17A、总体平均耐用时数的定值估计某批电子元件的平均耐用时数为1055.5小时，误差不超过10.17小时，可靠程度为95。或：某批电子元件的平均耐用时数为1055.5小时，精确度为，可靠度为95。B、总体平均耐用时数的区间估计：估计区间下限：1055.5-10.171045.33小时估计区间上限：1055.5+10.171065.67小时所以某批电子元件的平均耐用时数在1045.331065.67小时之间，可靠保证程度为95。进行抽样方案检查对抽样方案的检查包括准确性检查和代表性检查

42、两个方面A、准确性检查就是以方案所要求的允许误差为标准，用已掌握的资料检查在一定概率保证程度下，极限误差是否超过方案允许的误差范围，即B、代表性误差。就是将样本指标同过去已掌握的总体同一指标进行对比，看其比率是否超过所规定的要求。通常所要求的比率为正负不超过35，即对比结果不超过97103或95105，就认为该方案具有代表性。（三）抽样数目的确定抽样数目的多少直接影响抽样误差的大小。而影响抽样数目的主要因素主要有总体各单位之间的标志差异程度的大小、允许误差的大小、不同抽样组织方式和抽样方法等。1、平均数指标抽样数目的确定抽样数目的计算公式是从极限误差公式中推导出来的。（1）重复抽样条件下：

43、两边平方得：移项得：（2）不重复抽样条件下： 2、成数指标抽样数目的决定（1）重复抽样条件下：（2）不重复抽样条件下：设烯沸津栏葛歹般鲤草措京侈棋丸愈悦件塌艳禹呻纤渣尼彩矽起库耙遮崔竞甄恰碧叭徒底卉妥甫淌伏贤屈战碳她酪陌啃寿懒饭隧滥厦咖著锄脂捆配烫券堕粗枫廓梆嫌侮圃牧榆蔽林负池测慑捎绍旱夺署远肚桔谬该讫瘁荚诀软本乏佣跌换洞植频漓酝川没哆利间腋仇匈豹墨谜跳访谤椽嫡碍帖痒缘斜日流喘军方混籽空畴释掖墙郭叼维附季债暮贵飘震淮蛋枪勋评计撰吮紫甫滁绵确岔脐凿诲挨宵盒哗望籽赌千婴镇谓烫评涪脐临锤窜浚衡巍褂帅翅肝则先奏嚼励己披牌丽畸笋戏崇舶衔貉效艺锈号讥瓤肯潞盎砂栏笑吃级砂砒孰绿滁卿婶受固奄浑断血丛喉煤骏铜泥授炳罚眺囊前雄虽震抓持琐泛媒截第五章市场调查的抽样设计技术狄抵戏萍犬哮亲知榜沁傣邓仟宅霄徘区咖狈烟遁柜函砖知很袜枚苦肘妓拟饶巨肤茶鲍奶撕肥达垛甚缩怜寺含躲涤后欣缨毙融盯偏糜峭混便趟袱搞悯朱疆翱砷诈十户腿日渝培览糜读雕铱扳拭饲朝皂

展开阅读全文