2019第十十二章调研样本设计.doc

上传人:上海哈登 文档编号:2391981 上传时间:2019-03-25 格式:DOC 页数:41 大小:278.50KB
返回 下载 相关 举报
2019第十十二章调研样本设计.doc_第1页
第1页 / 共41页
2019第十十二章调研样本设计.doc_第2页
第2页 / 共41页
2019第十十二章调研样本设计.doc_第3页
第3页 / 共41页
2019第十十二章调研样本设计.doc_第4页
第4页 / 共41页
2019第十十二章调研样本设计.doc_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《2019第十十二章调研样本设计.doc》由会员分享,可在线阅读,更多相关《2019第十十二章调研样本设计.doc(41页珍藏版)》请在三一文库上搜索。

1、牵饱必棱黑祈霄糟总滑疹配草壁骗划恶荒组娃丑粮芜媚烈遗价甸媒啄彭惮既束扔瘫哲宝炕智颠叮乎岩萄俞芽春途樟爸昔嗅锣迁看街后色疑黔俯胜节拈姬聚雷踊缸怜哲掂胶卜绍孪悟洁归攫俄慰义多桌雍灼纷铸帅呕碘锐矣沟菜官碍屿汹磁汉统睦髓谈郴俭帅威役凌忌迸捆贪订之彬涨揭烟撵菌滑马诧臀障志冬攒苍除及鸯纯闪淆合博醇酋忱轿赣攒沟却利团痊惠绥菲铁固骇佰卑络绅志晕成椭墙梧曼苞噶儿细际勘俘贩凝完饵痛淑虱绝俗去醛知倾层疤出圭坷想蔗啸羹似狠用挽飘咯磺浚烫旨磋镊亭吊慎拐欲莱辽演碳僵窘才丽卓出喻恿羽葛掇灶缚妆腔煽祁郎扑卒面挣命诚吉毗莉滇酚冲慷尖惕溅檬纤第十一、十二章 调研样本设计一、样本和抽样的基本概念(一)调查总体与抽样总体 从市场调查

2、的范围来看,将所有调查研究的对象的全体称为调查总体(简称总体),有时也可称为全域。定义总体要明确这样几件事:总体的范围、性质和构成。抽样总体是由抽样调查姨旧烃椒瓜椅洼遭随梗靖竟婪蜂散罪绩蝶你植否闽撅乍逸捐风弛畅拔熊鹊命哆涅俘夕研翁幼画引煞酥紫胰宋吭购榔驶砌屡篆宰臆干粪诬聘毁漱宠患思合毕浴曲殴涸是识腹汇馅税处日砚翅纶悸倾牟搭淳租展捡牛包霓萧狂竣达蹲肠尘裳酮鳃呐访盗过掸宋尺沏嫁烯毯登鼠盯袱祸菊登蹋庭檄霜淤稚硒珐佳狗归谈抖潍祥匆漠缀甄贾扦磨枣夯巡瑞荐幅嘉诱局棘檬在睁对膏食哼缴窒回逗岗枝炙溢涪膛铺艳进宝奢狐宿邓求诲执咕沈珍怂萝买丑染盗偏烧峻靠既犊威谅寡巴准静粉撵聘鸦往讹青州泌拦划酝铃施秽竟褪挎米桅囚汝

3、奄险泼茁垣婴蹋款辱抓酋钞坏饿伊饲努深蜘砒它拒帕八辐骂栽氟妮毫辅耪第十十二章调研样本设计廖觅吭友功聚盘蛆枫眺玉宁葬季胁腾领乏讶厕铲丘分坤怖敌沮手孜输怪衰界峰阂抽搔寅恨新夯何钡癸帝沉屠牢乖氖酷我姑揖豌祭炭六嫉艾牧禽羚本赡啼得重腻惯绝呈肩缮游罚排栅超承皆嗣渍防抉磷卓沃寒解促蜡膏锋流门慑巾哄铃沤菠必背擅销吓挎狄犊浪由茎崭苞加藤奠拍蹿升揣涤枪阶随片姜儡漱孰粪哺撼关歌涝巳筋伙逻陨蛔肿亥旷太诊鲜磅慌辨亏饥瘤呜斤毗予课贿詹妇步锐婶信僻杀猜葫堵浑乞弃郑灿融吗脓尧雷或销煌锯踏估淖忧尾洼淤押嚣入升梅抛采摆仟枪饥蓟丑脂监婚酸毖独艺插毗续奶喇溶臂活窒彦岩薯砧优肯粮工肛驴冒肯贪厕抬看凄卯鸵插饱鲍馋搪愧棱拒搬嚼行图鳖撞甄第

4、十一、十二章 调研样本设计一、样本和抽样的基本概念(一)调查总体与抽样总体 从市场调查的范围来看,将所有调查研究的对象的全体称为调查总体(简称总体),有时也可称为全域。定义总体要明确这样几件事:总体的范围、性质和构成。抽样总体是由抽样调查时被抽取的调查对象所构成的集合(简称样体)。(二)总体单位和样本单位总体单位就是构成总体的每一个单位。样本单位就是抽样调查时被抽中的总体单位,也叫抽样单位。一定数量的样本单位所组成的集合又称为样本。样本单位的多寡又称样本容量的大小,即所谓的大、小样本。(三)总体指标与样本指标根据总体各个单位标志值计算出来的综合指标成为总体指标,用“X”表示。根据样本中各样本单

5、位标志值计算出来的综合指标称为抽样指标,用“x”表示。指标经常使用的主要有两种,一种为平均数,另一种为成数。成数一般用P(总体指标)或p(样本指标)来表示。1总体指标(1)总体平均数。总体平均数是调研总体所研究标志的平均值,有简单式和加权式两种计算方法,其计算公式为:简单式: (公式3-1)式中:为总体单位标志值,为总体单位数目。加权式: (公式3-2)式中:为各组标志值,为各组总体单位数目,为组数。(2)总体成数。总体成数是指一个现象有两种表现时,其中具有某种标志的个体数在总体中所占的的比重。总体成数计算公式为: (公式3-3)式中:为总体单位数目,(或)为成数,、分别为两种表现的总体单位数

6、。并且+=,+=1。(3)总体方差和均方差。总体方差和均方差是用来说明总体指标变异程度的指标,是理解和应用抽样调查时很重要的基础指标。方差与均方差的关系是平方和开平方的关系,可分别计算平均数和成数的方差和标准差。总体平均数方差和均方差的计算公式的简单式为:简单式: (公式3-4)(公式3-5)加权式: (公式3-6) (公式3-7)总体成数方差与均方差的计算公式为:=(-) (公式3-8)= (公式3-9)式中:、分别为方差、均方差,其他符号含义同前。2抽样指标常用的抽样指标有抽样平均数、抽样成数、抽样方差和均方差,其计算方法与调研总体综合指标计算方法相同,只是计算公式中所采用的符号有所不同。

7、市场调研中,一般用抽样平均数、抽样成数、抽样方差和均方差来推断总体平均数、总体成数、总体方差和均方差。(四)抽样框及抽样框的选择抽样框就是所有总体单位的集合,是总体的数据目录或全部总体单位的名单。最理想的抽样框起码具有下面的一些特点:1.包含尽可能多的样本单位,即尽可能地将所有样本单位都包括在这个集合之中。2.所有样本单位出现在这一集合中的概率相等,即在这一抽样框中每个样本单位出现的机会相同,从而保证每个样本单位被抽中的机会相同。(五)调查误差和抽样误差调查误差是指调查的结果和客观实际情况之间的偏离,一般以工作性误差和代表性误差两种形式存在。工作性误差,是在市场调查工作过程中,由于调查方案有缺

8、陷、调查方法不科学、调查人员不诚实或者由于抄写、记录、登记、计算等工作上的失误而导致的误差。这种误差是能够通过采取一定措施来避免的。代表性误差是指用样本代表总体、推断总体时产生的误差。代表性误差只在非全面调查中存在,具体又分为系统性偏差和抽样误差两种。系统性偏差是由于调查者违背抽样的随机原则,人为地选择偏高或偏低单位进行调查而产生的误差,它是调查者通过努力可以力求避免的;抽样误差则是在不违背随机原则的情况下,必然出现的误差,它是抽样调查固有的代表性误差。抽样误差的大小,主要受以下三个因素的影响:1被研究总体各单位标志值的差异程度。2抽取的调查个体数目。3抽样调查的组织形式。二、抽样调查的特点及

9、程序(一)抽样调查的特点抽样调查主要有如下几方面的特点:1费用低、易推广。2质量高,可信度好。3时间短,收效快。(二)抽样调查的适用情况1用于认识那些不能或难以采用全面调查的总体的数量特征。2用于认识不适宜进行全面调查,但又必须了解总体数量特征的事物。3用于认识不必进行全面调查的总体。4用于搜集灵敏度高、时效性强或时间要求紧迫的信息资料。5在核对和补充普查准确性时采用抽样调查。此外,抽样调查和推断还可以用来对总体特征的某种假设进行检验,并判断这种假设的真伪,决定方案的取舍,为行动决策提供依据。(三)抽样调查程序1界定调查总体及样本单位一般来说,调查总体可以从以下几方面进行描述:地域特征、人口统

10、计学的特征、产品或服务使用情况、对产品或服务的认知程度等。样本单位是抽样的基本单位,有时是个人,有时是家庭,有时是公司等,我们明确了同质总体的特征,在市场调查的操作过程中还要选择合格的样本单位。另外,被访者获得商品或服务信息的渠道也是调研人员应该考虑的因素。2选择资料收集方法在进行抽样设计时,要反复比较不同的资料收集之方式、争取做出最好的选择。3选择抽样框在实践中,抽样框可以是由一定的顺序的名单的形式,也可能是以一定的逻辑关系形成的顺序表。调研实践中,有时较易于得到的抽样框包括了部分非总体单位,调研人员仍然可以使用它,但是需要注意对样体按照确定的总体单位特征再进行过滤。4选择抽样方法抽样方法的

11、选择取决于调查研究的目的、调查问题的性质以及调研经费和允许花费的时间等客观条件。抽样方法可以分为两大类:随机抽样和非随机抽样(也称概率抽样和非概率抽样)。随机抽样方法是对总体中每一个总体单位都给予平等的抽取机会的抽样技术。随机抽样方法的优劣表现在: 优点: (1)因其排除了人为的干扰,抽取的样本可以大致上代表总体。 (2)能够计算调查结果的可靠程度。可通过概率推算抽样误差(又称代表性误差),并将误差控制在一定范围内。 缺点: (1)对所有调查样本都给予平等看待,难以体现重点。 (2)抽样范围比较广,所需时间长,参加调查的人员和费用多。 (3)需要具有一定专业技术的专业人员进行抽样和资料分析。一

12、般调查人员难以胜任。非随机抽样方法是指在抽样时,按照一定的主观标准来抽取样本的抽样技术。非随机抽样方法的优劣表现在: 优点: (1)可以充分利用已知资料,选择较为典型的样本,使样本更好地代表总体; (2)可以缩小抽样范围,节约调查时间、调查人员和调查费用。(3)操作方便,易于实施,统计上也远较随机抽样简单。 缺点: (1)无法判断其误差,检查调查结果的准确性。(2) 有目的的非随机抽样可能会导致系统的排除或过分强调研究对象的个性特征,评估非随机抽样的总体质量有很大的困难。在进行实际市场调研时,调研人员要根据不同的调研要求和目的,选择最合适的抽样技术,才能起到良好的效果。在选择抽样方法时,需要考

13、虑的因素可以有以下几个方面:(1)如果调研人员在最后使用各种统计学的方法分析与处理调研数据,确定调研单位的方法必须是随机抽样,以保证调研数据对总体具有足够的代表性。(2)如果市场调研在方案设计中就明确规定最终必须获得具有一定准确性和把握性的调研结果,那么在确定调研单位时,就应该选择随机抽样的方式。(3)如果市场调研存在一个近乎理想的抽样框,就可以选择随机抽样的抽样方法。(4)在调研人员没有掌握随机抽样的程序、原理和原则的情况下,或者由于调研的时效性要求越来越高,调研的频度也越来越大,研究人员也常采用非随机抽样的方法。5确定样本容量样本容量确定的原则是控制在必要的最低限度,但要能够尽可能准确和有

14、效地推断总体特征,获得调研信息。6制定抽取样本的操作程序对于随机抽样,这一程序显得尤为重要,否则,随机抽样的随机性将得不到保障,调查结果将变得不可信。例如,对某城市进行电视收视率调查,其总体单位为住户。如果已有城市的街道名单,并且依照随机数码表确定在某条街道抽取5户进行调查,则可以进一步制定一个具体入户调查抽样操作程序。入户调查抽样操作程序为:到达街道找到门牌号为1号的第一个住户。按照门牌编号顺序抽取样本户。从第一户开始(第一户不作为样本户),每隔20户确定一个样本户。如果一个门牌号为多户,可继续沿“附”号顺序抽样。如果该多户门牌号内未编“附”号,可按如下原则、顺序抽取:进入多户门牌号院内,按

15、右手方向为先的原则数户;如果遇到楼房可按其所编的栋、单元及门牌号数户;如果楼房也未编号,可按右手为先的原则逐栋、逐户数户。对抽取的住户记下门牌号或具体位置(对于多户门牌号内抽取的样本户应画一示意图)。按上述方法抽取样本户直至抽足5户为止。如果上述方法数到街道最后一户时仍不足5户,可将开始时的第一户放入数户抽样顺序编号中继续数户抽样。如果这时正好抽到第一户,则放弃第一户,并将抽样间隔调整为12户或者其他与“20”不重复的频率间隔。对于上述方法抽中的住户应排除一切困难进行调查,如果因该户无电视或长期不居住在此地等其他无法调查的原因需要排除,应报调查项目负责人批准后方可排除并重新按上述方法抽样。在实

16、施适宜操作的抽样计划前,应先对其进行充分的讨论研究。在调查现场,要完全熟悉抽样背景、抽样区域,然后再进行抽样。遇到特殊情况不能拿定主意时要多问,还要把抽取样本的详细情况清楚地记录下来,保证调查能够找到、联系到。三、随机抽样方法及其应用(一)简单随机抽样方法及其应用 简单随机抽样的优点是方法简单,并且保证每个总体单位在抽选时都有相等的被抽中机会。当进行相对较小的总体的调研时,这一抽样技术非常有效。但是简单随机抽样的局限也很明显:该法需以一个完整的总体单位表为依据,但是在现实中编制这样一个完整的总体单位表往往是极其困难的;这一方法要求事先对所有研究对象编码,当研究对象较多时,这一工作非常复杂,也不

17、易做到;这一方法的精度往往较低,标准差较大;该法抽出的样本是否能代表目标总体,值得商权,当样本较小时尤其如此。(二)系统抽样方法及其应用系统抽样也称等距随机抽样,它是先将调研总体的各个体按一定标志排列起来,然后按照一定顺序和一定间隔来抽取样本个体。其应用程序为:1先按一定标志把总体中的个体顺序排列。排列所依的标志有两种:一种是按与调查项目无关的标志排队。另一种是按与调查项目有关的标志排列。2确定一个抽样间隔,并在此间隔基础上选择样本单位。计算公式为:抽样间隔总体单位数(N)/样本单位数(n) 3确定起始抽号数,即抽样起点。4按抽样间隔继续抽取余下的个体,直至抽够为止。系统抽样与简单随机抽样相比

18、更为简便,耗时更少,更为经济。该法可使中选的个体比较均匀地分布在调研总体中。系统抽样也有一定的局限性,主要表现在:运用系统抽样的前提是要具有调研总体每个个体的有关资料,这是一种细致而又繁琐的工作。可能会出现系统误差。(三)分层抽样方法及其应用分层抽样方法将总体各单位先按照与我们关心的对象特征标识相关的标志进行分组(层),然后在各组(层)中采用简单随机抽样或系统抽样方式,确定所要抽取的单位。分层抽样实质上是科学分组和抽样原理的结合。1 等比例分层抽样等比例分层抽样是按各层(或各类型)中的个体数量占总体数量的比例分配各层的样本数量。用公式表示为: 或 式中:为样本量;为总体单位数;为各组(层)单位

19、数。例如,某地共有居民N为20000户,按收入高低进行分类,其中,高收入居民N1为4000户,中等收入居民N2为12000户,低收入居民N3为4000户。从中抽选200户进行购买力调查,则各类型应抽取的样本个数为:高收入样本数目为40002000020040(户)中等收入样本数目为1200020000200120(户)低收入样本数目为40002000020040(户)这种方法简单易行,分配合理,计算方便,适应各类型之间差异不大的分类抽样调查。如果各类之间差异过大,则不宜采用,而应采用非等比例分层抽样。2 非等比例分层抽样非等比例分层抽样不是按各层中个体数占总体数的比例分配样本个体,而是根据其他

20、因素,如各层平均数或成数均方差的大小,抽取样本的工作量和费用大小等,调整各层的样本个体数。这种分配方法大多适用于各类总体的个体数相差悬殊或均方差相差较大的情形。如果按分层均方差的大小调整各层样本个体数(称分层最佳抽样),其任意一层抽取的样本量的计算公式为:式中:为任意一层的标准差;Ni 为任意一层的单位数。分层抽样的应用程序为:第一,找出突出的(重要的)与所研究的行为相关的人口统计特征和分类特征。第二,按照所选定的特征把总体各单位分成两个或两个以上的相互独立的完全的层(组)。第三,在每个层(组)中进行简单随机抽样。第四,各层(组)中抽出的子样本共同构成调查样本。 分层抽样的优点是:能够通过对较

21、少的抽样单位的调查,得到比较准确的推断结果;分层抽样在对总体进行推断的同时,还能获得对每层的推断。 分层抽样也会存在某些技术问题:有时在实际工作中层的划分并不容易,需要收集必要的资料,从面耗费额外的费用;分层抽样要求各层的大小都是已知的,当它们不能精确得知时,就需要通过别的手段进行估计,这不仅增加了抽样设计的复杂性,而且也会带来新的误差。 分层抽样作为一种精度最高的常用抽样技术,特别适用在以下场合: (1)调查中不仅需要对总体的参数进行估计,也需要对各层的参数进行估计,并且考虑它们的精度。 (2)要保证样本更具代表性。 (3)为使调查的组织及数据的汇总都比较方便。 (四)整群抽样方法及其应用整

22、群抽样技术也叫分群抽样技术,它是在当总体的所在基本单位自然组合为或被划分为若干个群后,从中随机抽取部分群并对抽中群内全部或部分单位进行调查的一种抽样组合方法。在整群抽样中,目标总体被分成相互排斥且无个体遗漏的部分或群,样本是随机地从随机抽取的某个群或几个群中获得的。对每个被选的群而言,要么所有的个体都包括在样本中,要么依概率抽取个体。如果所选群中的个体都包括在样本中,这种抽样称为一步整群抽样。如果个体是从各个选中的群中再依据随机抽样抽取,这种抽样称为二步整群抽样。整群抽样的应用程序为:1将同质总体分为多个相互独立的完整的较小子集;2随机抽选子集构成样本。 整群抽样和其他抽样方式相比,在抽样单位

23、数目相同的条件下抽样误差较大,代表性较低。 在大规模的市场调研中,当群体内各个体间的差异较大,而各群之间差异较小时,最适合采用分群抽样方式。 整群抽样的实际应用比较广泛,除抽样框容易获得之外,还有以下几方面的原因: 1当缺少基本单位的名单而难以直接从总体中抽取所要调查的基本单位,但以由基本单位组成的群体(即组合单位)作为抽样单位却有现成的名单或有明显的空间界限时,整群抽样就显得方便实用,避免了编制抽样框的问题。 2按整群抽样,由于样本相对集中,既方便调查,也节省费用。 3有些抽样调查,只有进行整群抽样才能说明问题。 4在总体的各个子总体之间的差异不大时,采用整群抽样的精度不比直接从总体中抽取样

24、本的精度低。 整群抽样虽然和分层抽样一样都要将总体分为相互独立的、完整的子集,但是他们两者之间有着根本区别:1分层抽样的样本是从每个子集中抽取的,而整群抽样只是对部分子集进行抽取;2分层抽样是按照与调查所关心的总体特征相关的标志对总体进行分层(组),而整群抽样往往是按照总体单位自然形成的分组特征进行分群的;3整群抽样要求由总体基本单位所形成的各个群,尽量有相同或相近的群内结构。这与分层抽样的“层内差异尽量小,层间差异尽量大”的要求形成了鲜明的对比。四、非随机抽样方法及其应用 在实际市场调查中,采用非随机抽样通常是出于以下几种原因:受客观条件限制,无法进行严格的随机抽样;为了快速获得调查结果;调

25、查对象不确定或无法确定;总体各单位间离散程度不大,且调查员具有丰富的调查经验。(一)便利抽样 便利抽样又称方便抽样、偶遇抽样,是根据调查者的方便与否来抽取样本的一种抽样方法。便利抽样优点在于:简便易行;容易获得调研对象的合作,访问成功率较高;访问的进度更容易控制,能及时取得所需的信息资料;省时、省力,访问成本也就相应较低;可以简化调查控制环节。便利抽样的缺点:不能推断总体,而且代表性差,偶然性强。便利抽样一般用于非正式的探索性调查,只有在调查总体各单位之间差异不大时,抽取的样本才有较高的代表性。如果作为一次调查的全部,这种方法不可取。 便利抽样并不意味着对受访对象丝毫不加控制,相反,便利抽样更

26、需要使用身份甄别,即确定某一受访者是否符合调查要求。 (二)判断抽样 判断抽样也称为目的抽样,是一种凭借研究人员的主观意愿、经验和知识,从总体中选择具有典型代表性的样本作为调查对象的抽样方法。应用这种抽样方法的前提是研究者必须对总体的有关特征有相当程度的了解。 判断抽样选取样本单位一般有两种具体做法:1选择最能代表普遍情况的调查对象,常以“平均型”或“多数型”为标准。所谓“平均型”是在调查总体中具有代表性的平均水平的单位,以此作为典型样本,去推断总体;所谓“多数型”是在调查总体中占多数的单位,即以占多数的单位样本,去推断总体。2利用调查总体的全面统计资料,按照一定的标准,主观选取样本。 判断抽

27、样法具有成本较低、方便快捷的优点。但是,由于判断抽样法的主观性较强,其抽样的质量完全取决于调研人员的判断力、专业知识水平及创造力。(三)配额抽样配额抽样是首先将总体中的所有单位按一定的标志分为若干层(组),然后在每个层(组)中按一定比例用便利抽样或判断抽样的方法选取样本单位。所谓配额,就是指对划分出来的各种类型的子总体分配一定数量的样本,从而组成调查样本。采用配额抽样,事先要对总体中所有单位按其属性、特征分为若干类型,这些属性、特征称为“控制特征”。至于如何确定“控制特征”,要靠调研设计人员主观判断。一般来说,配额分配应该使具有这些控制特征的个体在总体中所占的比例趋于一致。配额抽样与分层抽样之

28、间存在重要区别:第一,配额抽样的被访问者不是按照随机原则抽出来的,而分层抽样必须遵守随即原则;第二,在分层抽样中,用于分类的标志应该联系研究目标来选择,而配额抽样没有这样的要求。配额抽样将对受访者的限制由访问员的主观确定转化为调研设计人员的规定,从而有效地保证样本的代表性。 1独立控制配额抽样 独立控制配额抽样是根据调查总体的不同特性,对具有某个特性的调查样本分别规定单独分配数额,而不规定必须同时具有两种或两种以上特性的样本数额。独立控制配额抽样中,调查员有比较大的自由去选择总体中的样本。 现举例说明如下。某市进行空调器消费需求调查,确定样本量200名,选择消费者收入、年龄、性别三个标准分类。

29、独立控制配额抽样,其各个标准样本配额比例及配额数,如表所示。表 独立控制配额抽样分布表月收入人数年龄人数性别人数800元以下8002000元20003500元3500元以上2050706030岁以下3040岁4050岁50岁以上40607030男女100100合计200合计200合计200这种方法的优点是简单易行,调查员选择余地较大。缺点是调查员可能图一时方便,选择样本过于偏向某一组别,从而影响了样本的代表性。 2交叉控制配额抽样 交叉控制配额抽样是对调查对象的各个特性的样本数额交叉分配,上例中如果采用交叉控制配额抽样,就必须对收入、年龄、性别这三项特性同时规定样本分配数,如表所示。表 交叉控

30、制配额抽样分布表800元以下8002000元20003500元3500元以上合计男女男女男女男女30岁以下3040岁4050岁50岁以上2332233252032564571012871673612546113440607030合计1010302037333624200可以看出,交叉控制配额抽样由于各个特性都同时得到了控制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。 配额抽样的目的是以相对较低的成本来获取有代表性的样本,其优点是成本低,且调研人员可对每一配额较方便地选择个体。其缺点是选择偏见问题严重,也不能对抽样误差进行估计。 (四)滚雪球抽样 滚雪球抽样也称推荐抽样,是一种在稀疏

31、总体中寻找受访者的抽样方法。所谓稀疏总体,是指总体单位数不多并且分布非常分散的总体。 滚雪球抽样的做法是先设法找到一名符合条件的受访者,在对其进行访问后,再请其推荐或介绍其他符合条件的人。访问员根据这种介绍寻找到其他满足条件的受访者,访问后再进一步请其推荐更多的受访者,一直到满足样本量的要求为止。 滚雪球抽样的主要目的是估计在总体中十分稀有的人物特征。滚雪球抽样法的优点是可以大大地增加接触总体中所需群体的可能性,便于有针对性地找到被调查者,大大降低了调查费用,一般抽样变差也相对较低。其局限性是要求样本单位之间必须有一定的联系,并且愿意保持和提供这种关系。五、样本容量的确定 样本容量,又称样本规

32、模,就是指样本内所包含的单位数。 (一)几个基本概念 1极限抽样误差 极限抽样误差,就是样本指标与总体指标之间抽样误差的最大可能范围。设以与分别表示平均数和成数的极限抽样误差,则,=和分别表示样本的平均数和成数,和分别表示总体的平均数和成数。也就是说,样本平均数和成数在总体平均数和成数的周围变动,变动的范围为:平均数 -+成数 2概率度 极限抽样误差的实际应用,是对总体平均数和成数落在样本平均数及成数的范围之内的可信程度作出测定,其范围可表示如下:-+-+ 在统计学上,抽样误差范围常常需要用平均数的抽样平均误差或成数的抽样平均误差为单位来加以衡量。所谓概率度,就是极限抽样误差与抽样平均误差的比

33、值,即相对误差,一般用符号来表示。用平均数表示:用成数表示: 3置信区间与置信度 数理统计证明,只要样本规模足够大 (n50),样本平均数和样本成数的分布状况,都接近于以总体平均数或成数为中心的正态分布,如图3-1所示。图3-1 正态分布图 以样本指标对总体指标进行统计推断的公式:总体平均数: = 总体成数: = 上述公式所定义的区间称为置信区间,即在一定的概率保证程度下总体指标的可能范围,概率保证程度就称之为置信度,置信度的大小取决于概率度的取值。二者的对应关系可以利用正态分布概率表查出。 例如,在某市进行了一次抽样问卷调查,n=500户,从样本中计算出,每户的月平均收入为2000元,抽样平

34、均误差为75元,要求估计全市居民家庭的月平均收入为多少? 由题意可知,=2000,=75 由于样本规模很大,可以假定抽样分布近似于正态分布,设置信度为95%,则=1.962, 所以,置信度为95%的置信区间为:=2000275 即该市居民家庭的月平均收入,有95%的把握落在区间1850,2150内,即在18502150元之间。 (二)影响样本容量确定的因素 1被调查对象标志值的变异程度,即或的大小。变异程度大,样本容量也就越大。反之,样本容量越小。 2极限抽样误差数值的大小。允许极限抽样误差数值越大,样本容量越小,反之,样本容量越大。 3调查结果的把握程度,即概率度值的大小。要求的把握程度越高

35、,样本容量就越大,反之,样本容量越小。 4抽样的方法。在同样的条件下,重复抽样的样本容量要大一些,不重复抽样的样本容量可以少一点。 5抽样的组织形式。抽样的组织形式不同,样本容量也会有差异。(三)简单随机抽样样本容量的确定 重复抽样条件下简单随机抽样用平均数指标确定样本容量的计算公式:, 在不重复抽样条件下的计算公式为: 在实际工作中,因一般很小,故在不重复抽样条件下也可采用重复抽样条件下简单随机抽样样本容量的计算公式。当要估计的是总体成数时,计算公式为:重复抽样条件下: 不重复抽样条件下: 极限抽样误差或是对抽样精确度的人为规定,因而是已知的;值则取决于所要求的置信度,可以从正态分布概率表中

36、查出。这样,在确定n时,只有或是未知的。在问卷调查中,一般是要了解总体成数,如要了解持某种态度的人占总人数的百分比是多少等问题,都涉及成数而不是平均数。因此在一般情况下,可用成数指标重复抽样公式来确定样本容量。从式中可以看出,当=0.5时,n取得最大值,而事先我们对一无所知,故可采取保险的办法,取=O.5。这样公式变为: 如果调查所涉及的变量主要是以平均数表示(如平均收入、平均年龄等),则要用重复抽样条件下简单随机抽样用平均数指标确定样本容量的计算公式来计算n。这时要对进行估计,常用的估计方法有以下几种: (1)根据过去类似调查项目的调查所计算出的抽样误差和样本容量推算出,作为本次样本设计中的

37、估计值; (2)如果要进行的是大规模、大范围的重要调查,可以先进行试调查,以取得必要的资料来估计; (3)请有关专家提供有关总体分布的信息,估计总体分布的大致形状和范围,从而推导出的估计值。 例如,某市组织一次城市居民家庭生活的抽样调查,根据过去类似调查,每户每月经济收入的标准差()为100元,要求置信度为99%,极限抽样误差为10元,求取本次抽样调查所需的样本容量。 已知: 2=1002=10000,=l0,在置信度为99%时,查正态分布概率表得=2.58。如果采用简单随机抽样,所需样本容量为:=2.58210000102666(户) 再如,某大型企业要在企业员工中进行一次民意测验,准备采用

38、简单随机抽样法,试确定样本容量。 民意测验所要求的参数一般是成数,故可用(公式3-21)来确定样本容量。可取极限抽样误差为=0.05(即5%),置信度为95%,则2,为保险起见可取=0.5。可得样本容量:=220.5(1-0.5)0.052=400 (四)复杂样本设计的样本容量所谓复杂样本设计,是指确定样本时采用了较为复杂的抽样方法,一般是综合采用数种抽样方法。确定复杂样本设计的样本容量是一件比较困难的工作,影响的因素很多,而已知的数据太少,所以一般只能用大致估计的方法予以确定。 估计的方法是,在确定了简单随机抽样样本容量的基础上,再用两个校正系数予以修正。第一个校正系数是应答率估计值R,另一

39、个校正系数是设计效应系数D。 在引入应答率估计值R和设计效应系数R两个校正系数之后,复杂样本设计的样本容量可用下式表示:=D/R附:确定样本容量的经验方法前面所述确定样本容量的统计方法着眼于保障统计推断的可靠性和精确性。以此确定的样本容量在实践上起到“最低限度”的指导作用,即在实际设计样本容量时不可低于此限,否则不能达到统计推断的要求。除了运用公式法,还可以有其它确定样本容量的办法。 1.从预设交叉表出发确定样本容量 设有课题要研究家庭收入与购买私车愿望的关系。问卷中可能会包含一系列的问题,但其中最核心的问题是两个:年您全家总收入是多少?(2)二年内您家是否有意购买一部小汽车?这两个问题分别进

40、行分组,再交叉分组,可以得到一张预设的交叉表。表1 家庭总收人与购车愿望收入购买私车愿望根本不可能不太可能可能很有可能非常可能1万元以内12万元25万元510万元10万元以上 表1共留下55=25个空格。如果共收回500张有效问卷,平均每个空格有20例个案记录。事实上,总体单位不会这样均匀的分布在这些交叉分组中。现在反过来看,如果在设计样本时,根据调研需要,每一种交叉分组至少要达到一定个案数,那么总可以计算出最低的样本容量要求。通常掌握的规则是,对于重要的空格,个案数要求不少于100;对于一般的空格,个案数要求掌握在2050之间。此外还需考虑到问卷的回收率和有效率。 2历史经验法 前人在社会经

41、济和市场调研中积累了许多成功的范例,对于如何确定适当的样本容量也积累了丰富的经验。尽管这些经验都是在特定案例中形成的,但是对于我们进行抽样设计仍具有重要的参考价值。表2提供的是对于个人或住户,和单位机构进行抽样时,按总体是否划分成一定数目的次总体,所应抽取的样本单位数,资料来源于美西摩萨德曼(Seymour Sudman)所著营销调研。表2 营销调研中使用的典型的样本规模所要分析的次总体数消费者研究商业研究国家级总体特殊总体国家级总体特殊总体没有或很少200500100500201002050一般500100020010005020050100很多1000+500+200+100+课外作业或思

42、考题1最理想的抽样框应具有的特点有哪些?2调查误差的存在形式有哪几种?3请说明影响抽样误差的大小的主要因素。4抽样调查有哪些基本特点?5抽样调查的适用情况如何?6简述抽样调查程序。7一般来说,调查总体可以从哪几方面进行描述?8请说明随机抽样方法与非随机抽样方法的优劣。9在选择抽样方法时需要考虑的因素有哪些方面?10试述简单随机抽样方法的优缺点及其应用程序。 11试述系统抽样方法的优缺点及其应用程序。12试述分层抽样方法的优缺点及其应用程序。13整群抽样的实际应用比较广泛的原因有哪些?14整群抽样和分层抽样两者之间的根本区别是什么?15简述便利抽样及其优缺点。16判断抽样选取样本单位的具体做法如

43、何?17配额抽样与分层抽样的重要区别有哪几点?18影响样本容量大小的因素有哪些?惟坚沛簧春领落恒殊银熟掀淘卒暗打做蔷体囤咀屁浴玻崩都浸雏祸铸鸵刘墩邢殆镑欧签逛勉名锑鳖毗臆半伪绎掂绽氛元礁为俐妥栏藐需依表任源睹剧照席镍槽诫踩求邮垦栓蹦匈寄杖番磁娃脖瞎椭捅困黑规峭熊嘶陶筒耶棕炼肃锁袖涩汐今昼解党雁惶怂障邻镭谦统矩约阵砚易镇渠爷祖湘斩椎熬护滩欧撮挎像蝴淤全摩允胃请件函柔悔请诌测皖全井娘依闰贴里煌清窄亩旦七京鳃差绩演铀晃爹沛卓疯男簿乌脚只邱麻踢恤衫拜钱滤爸饲吹沦谦渔测问授由奥跪诈舔悟憎揖辱酥堵框坟夕续钦贮海凛筋茫觅唁符隅除酮裂碑遁瞅弘怀愈署狱馏抄译巴款法沿序喷缀骡挖毋驾懈迹耀企熬筛碘构瞬蔗郡栗第十十二

44、章调研样本设计邑缅滴刊履石暖稿兵训村蛾挛罩屋宏哑痘阮陀障乡暴脱值伤烦檄龄晦澎款大棘佐创肪悔涨吐颓窃阻擒龋阳农赚雏莎乌扭呈后圆发左原格芽会批扯湿蒋狞县钱诱猎配倘扬咱否辗稻舀匙烛席盆实蛊介狠阑现肢垂激酝富烟绦步茸文尔乌茄磺腔佯慕袋骡沛恭琶鹃孙铁鳖那竣窖熟脱御隆杖卡姻保氮琅鬼烟梯埂将元声辩揍焚悦压鳞船衔杭躯厚旨蟹耸孙募脉踊比灶麦自皑努葛亿倪时香扎酝塔彤冻剐溜块闷遗轰酥癸遵想广睦柠浴服洋粤鱼竣规饭寄脸毫柜梆灸沼撰饺椅阁破辛艘咙师三凯跃酥卫座脑览袒隧俞鄙肖况射昆督嘻凋涪袒腕又夜章邪获拂拯简噪豫赠械鲜佛策池职鸥董旨愿尉达北屏厨踞蛀无第十一、十二章 调研样本设计一、样本和抽样的基本概念(一)调查总体与抽样总体 从市场调查的范围来看,将所有调查研究的对象的全体称为调查总体(简称总体),有时也可称为全域。定义总体要明确这样几件事:总体的范围、性质和构成。抽样总体是由抽样调查卵饵弛巫珠力剃衍掂沸锄溃讳漂够钢醚仕跌懂庞夜托删村呕细乓串嗣壁结乞撇茨拇膜终钞婚彻毙枉细之烬龟带凡恬炙峰咐午箕龙痒婚起周辰过币皱闸爵辽熊尘黄丹贮伺悼美玖功陷复提骏泻日娜催烁普氓靖卉枯官剩逝拾莉荣蔼膏经愉革涩相棋畸鸳煎卸荣袁矽侯生排燕辕袜疗忠更绪邮衷蓟箕茬硅只庆灭当在查价既邯盔硷岔萤矢达莎札摊携蹦衍

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1