社会统计ppt课件.ppt

上传人:本田雅阁 文档编号:2666941 上传时间:2019-05-02 格式:PPT 页数:104 大小:1.21MB
返回 下载 相关 举报
社会统计ppt课件.ppt_第1页
第1页 / 共104页
社会统计ppt课件.ppt_第2页
第2页 / 共104页
社会统计ppt课件.ppt_第3页
第3页 / 共104页
社会统计ppt课件.ppt_第4页
第4页 / 共104页
社会统计ppt课件.ppt_第5页
第5页 / 共104页
点击查看更多>>
资源描述

《社会统计ppt课件.ppt》由会员分享,可在线阅读,更多相关《社会统计ppt课件.ppt(104页珍藏版)》请在三一文库上搜索。

1、Ming-chi Chen,社會統計,Page.1,社會統計,第四講 抽樣分配與點估計,Ming-chi Chen,社會統計,Page.2,Sampling Theory and Some Important Sampling Distributions,統計主要問題在於如何透過樣本的統計量來推估或檢證母體的參數(parameters)。 A parameter is a numerical quantity that describes some characteristics of a population. 參數為描述母體某些特性的數值。 如、母體中位數等皆為參數。,觀念,Ming-ch

2、i Chen,社會統計,Page.3,Sampling Theory and Some Important Sampling Distributions,為了要瞭解母體的特性,我們可以對於母體中的所有單位進行普查(census),但普查有很多缺點: (一)耗時耗力,成本高。(二)無法蒐集較為深入、詳細的資訊,(三)普查錯誤機率大。 因此我們經常從母體中抽取少量的樣本,計算樣本統計量來幫我們推估母體的性質。,觀念,Ming-chi Chen,社會統計,Page.4,Sampling Theory and Some Important Sampling Distributions,樣本統計Samp

3、le statistics 是用來描述樣本的特性的數量,。 Sample mean 、sample variance S2, and the sample proportion 樣本統計為觀察到的樣本之函數,樣本的統計量隨著取樣的不同,會有不同的變化。因此,樣本統計量本身可以被視為是一隨機變數。,觀念,Ming-chi Chen,社會統計,Page.5,Introduction to Sampling Distribution,一個樣本的統計量(如樣本平均數)是樣本的函數,觀念,Population 母體參數,x4,x49,x103,x354,x41,Sample樣本平均數,x4,x42909

4、,x1005,x31,x411,隨機變數,的特定值,Ming-chi Chen,社會統計,Page.6,Introduction to Sampling Distribution,用於推估母體的參數()的樣本統計量(如X-bar),稱為估計式(an estimator)。,觀念,將實際抽樣所得到的樣本帶入估計式,得到的數值(如-bar)稱為估計值(estimate),Ming-chi Chen,社會統計,Page.7,Estimator and Estimate,從母體中觀察到一組隨機樣本 x1, x2, xn ,母體參數的估計式estimator為一樣本統計sample statistic

5、,它是一種運算規則rule,告訴我們如何運用x1, x2, xn去計算出母體參數的估計值。 將x1, x2, xn帶入估計式estimator所得到的數值稱為估計值estimate 。,觀念,Ming-chi Chen,社會統計,Page.8,Sampling distribution抽樣分配,樣本的統計量為一隨機變數,每一個特定變量出現的機率不同,因此,樣本統計量為一機率分配,稱為樣本統計的抽樣分配(sampling distribution),為多次抽樣結果的機率分佈。 例如從母體中抽固定大小n的樣本,求取每一個樣本的平均數,這些平均數會有一個分布,這就是抽樣分配。 人社系全體同學200人

6、,每次抽25人測量其平均身高,一共可以抽出C20025個樣本,每個樣本都有其平均身高,把這些數值集合起來會有一個分配,這就是樣本分配。 或者從母體中抽固定大小n的樣本,求取每一個樣本具有某種特質(ex.投票給A候選人)的比例,這些比例也會有一個分布,這也是抽樣分配。,觀念,Ming-chi Chen,社會統計,Page.9,Desirable properties of estimators,可以用來估計母體參數的樣本統計量有很多種,例如我們可以用樣本平均數 來估計母體平均值,也可以用樣本的中位數來估計。對於某些樣本來說,樣本平均值並不見得是母體參數的最佳估計值。 究竟一個好的估計式必須具備哪

7、些條件?我們需要一些標準來評估各種估計式。,觀念,Ming-chi Chen,社會統計,Page.10,好的估計式必備條件?,不偏性(unbiased) 有效性(efficiency) 最小變異不偏性 漸近不偏性 一致性 充分性,牽涉數理統計部分,略過不談,Ming-chi Chen,社會統計,Page.11,Sampling Error抽樣誤差,首先我們希望估計的誤差愈小愈好 估計值與被估計的母體參數之間的差距稱為抽樣誤差。 抽樣誤差隨樣本不同而有變化,如果估計量的機率分配集中於母體參數的周遭,則抽樣誤差較小,反之較大。,觀念,Ming-chi Chen,社會統計,Page.12,Sampl

8、ing Error抽樣誤差,從母體中抽取一隨機樣本的方法有很多種,如果從N中取n個元素(without replacement)做為樣本,且每個n被抽到的機率相同,則稱為簡單隨機樣本(a simple random sample)。 從N中取n共有NCn=N!/n!(N-n)!取法。每一個隨機樣本被選取的機率為1/ NCn。,觀念,Ming-chi Chen,社會統計,Page.13,Derivation of a Sampling Distribution抽樣分配,例題: 一母體中有五個元素1,3,4,8,9,從這母體中選取n=3的簡單隨機樣本,列出所有可能樣本的機率分佈,並計算各樣本的平均

9、數、中位數,評估何者為較優良的估計量?,觀念,Ming-chi Chen,社會統計,Page.14,Derivation of a Sampling Distribution抽樣分配,1,3,4,8,9,觀念,母體參數 =(1+3+4+8+9) /5 =5,N=5, 樣本個數為3的 樣本共有 C53=10,簡單隨機樣本(a simple random sample),每一個樣本出現的機率相同。,Ming-chi Chen,社會統計,Page.15,Derivation of a Sampling Distribution抽樣分配,觀念,平均數的抽樣誤差,中位數的的抽樣誤差,Ming-chi C

10、hen,社會統計,Page.16,Derivation of a Sampling Distribution抽樣分配,觀念,Sampling distribution of sample mean,Sampling distribution of sample median,樣本平均數的抽樣分配,樣本中位數的抽樣分配,Ming-chi Chen,社會統計,Page.17,Sampling Distribution,三個有關估計量的樣本分佈的問題 (1) 估計量的抽樣分配呈現何種型態?是否為常態分配? (2) 估計量的抽樣分配平均值為何? (3) 抽樣分配的變異數為何?,Ming-chi Che

11、n,社會統計,Page.18,Sampling Distribution,在眾多樣本裡,有些樣本的平均值大於母體平均值 ,有些小於,如果計算所有樣本平均值的平均,是否與母體平均值相近?,Ming-chi Chen,社會統計,Page.19,Sampling Distribution,如果抽樣分配的平均值(期望值)等於欲估計的母體參數,我們稱之為母體參數的不偏估計式(unbiased estimator)。 一個不偏估計式的抽樣分配會集中於母體參數。The sampling distribution of an unbiased estimator is centered at the popu

12、lation parameter. 如果抽樣分配不集中於母體參數,則此估計量有偏誤(biased)。,Ming-chi Chen,社會統計,Page.20,Sampling Distribution,令A為母體參數 的一個估計式,如果 E(A) = 則A為母體參數的不偏估計式。 如果E(A) , 則稱A為的偏誤估計式 (a biased estimator of ). 偏誤量為: Bias=E(A) - ,Ming-chi Chen,社會統計,Page.21,Calculating E(X) and E(M),觀念,Sampling distribution of the sample mea

13、n,Sampling distribution of the sample median,母體中數為4,Ming-chi Chen,社會統計,Page.22,Biased and unbiased estimators,E(A),E(B),Bias of B,Sampling distribution of B,Sampling distribution of A,Unbiased estimator of ,Biased estimator of ,Ming-chi Chen,社會統計,Page.23,Relative Efficiency,假設A為的不偏估計式。儘管A的抽樣分配會集中於,但

14、並不代表A中的任何特定值皆剛好等於。一個好的估計量除了抽樣分配要集中於母體參數外,其抽樣分配的標準差要愈小愈好。 一個母體參數可以有很多個不同的不偏估計量,如隨機變數為對稱分配時,樣本平均數與樣本中位數皆為不偏估計量,但我們喜歡比較集中的估計量。,Ming-chi Chen,社會統計,Page.24,高偏差低變異 高偏差高變異,不偏與有效,Ming-chi Chen,社會統計,Page.25,低偏差高變異 低偏差低變異,不偏與有效,Ming-chi Chen,社會統計,Page.26,Relative Efficiency,假設XN(, 2),樣本數為n,樣本平均數與樣本中位數何者為較好的估計

15、值? 由於兩者皆為不偏估計量,因此我們傾向於採用標準差較小的估計量X:,Ming-chi Chen,社會統計,Page.27,Relative Efficiency,Let A and B be two unbiased estimators of some population parameter. The relative efficiency of A with respect to B is the ratio of their variances; that is;,The estimator A is said to be more efficient than B if Var(

16、A) Var(B),Ming-chi Chen,社會統計,Page.28,Relative Efficiency,假設XN(, 2),E(X) = E(M) =,Sampling distribution of X,Sampling distribution of M,Ming-chi Chen,社會統計,Page.29,Minimum Variance Unbiased Estimator,當估計式A是母體參數的一個不偏估計式 ,而且沒有其他的不偏估計式有更小的變異數時,則A為 的最小變異不偏估計式(minimum variance unbiased estimator) x就是的最小變異不

17、偏估計式。,Ming-chi Chen,社會統計,Page.30,Sampling Distribution of Sample Mean,收入的次數分配,=30.47 =16.54,取樣本數n=20的樣本來計算樣本平均值,Ming-chi Chen,社會統計,Page.31,Sampling Distribution of Sample Mean,取n=20的樣本五十個,並計算樣本平均值,其抽樣分佈:,E(X)=30.47 Sx=2.573,Ming-chi Chen,社會統計,Page.32,Sampling Distribution of Sample Mean,抽樣分配較原分配接近常態

18、分配,E(X)=30.47 Sx=2.573,=30.47 =16.54,Ming-chi Chen,社會統計,Page.33,無論母體為何種分配,樣本平均數的分配呈現鐘型且接近常態分配。而且當樣本數n愈大,趨近於常態分配的情形欲明顯。 X的抽樣分配其平均值等於母體平均數:,Sampling Distribution of Sample Mean,抽樣分配的標準差比母體標準差小。,Ming-chi Chen,社會統計,Page.34,Very simple random sample (VSRS),觀念,A very simple random sample is a sample whose

19、 n observations x1, x2, xn are independent. The distribution of each X is the population distribution p(x): that is P(x1) = P( x2) = P(xn) = population distribution P(x) Then each observation has the mean and standard deviation of the population. E(x) = , Var(X) = 2,Ming-chi Chen,社會統計,Page.35,Introd

20、uction to Sampling Distribution,樣本中每一個元素被抽到的機率皆相同 每一個元素的期望值為母體平均數 每一個元素的標準差為母體標準差,觀念,Population 母體參數,P(x1) = P( x2) = P(xn) = population distribution P(x),E(x) = , Var(X) = 2,Ming-chi Chen,社會統計,Page.36,Ming-chi Chen,社會統計,Page.37,Ming-chi Chen,社會統計,Page.38,Standard Error of X-bar,The typical deviatio

21、n of X from its target represent the estimate error, and so it is commonly called the standard error標準誤, or SE:,Ming-chi Chen,社會統計,Page.39,Small-population sampling,If sampling is done without replacement from a finite population containing N elements, then the variance of X is,Finite population cor

22、rection factor,有限母體修正因子,若n/N=5%時可忽略不計。,Ming-chi Chen,社會統計,Page.40,Small-population sampling,若樣本數為n=1,則是否放回無關緊要。 若樣本數n=N,即樣本數等於母體數,則變異數必等於零。 在正常的情況下,母體數N通常都比樣本數n要大很多,因此放回與否幾乎不造成影響:,Ming-chi Chen,社會統計,Page.41,Standard Error of X-bar,SE的公式告訴我們: (1)母體的標準差愈小,SE愈小。 (2)樣本數愈大,SE愈小。,Ming-chi Chen,社會統計,Page.4

23、2,例題,設x1, x2, xn為抽取自任意母體f(x)之一組隨機樣本,證明樣本平均數及樣本變異數分別為及2的不偏估計式。,Ming-chi Chen,社會統計,Page.43,Variance of Discrete Random Variable,Ming-chi Chen,社會統計,Page.44,Ming-chi Chen,社會統計,Page.45,圖3.1 某診所等待看牙時間(母體),4500人(母體),等待50分鐘以上的有5,Ming-chi Chen,社會統計,Page.46,圖3.2 等待看牙時間(樣本1,50人),等待50分鐘以上的佔20,Ming-chi Chen,社會統計

24、,Page.47,圖3.3 等待看牙時間(樣本2,50人),等待50分鐘以上的佔10,哪一個樣本比較好?,Ming-chi Chen,社會統計,Page.48,概念複習,利用樣本的統計量去推論母體的參數時,由於母體中的各個元素本身有所不同,因此不論抽樣是否客觀公正,樣本統計量與母體參數之間總是會有一些差異,稱為估計誤差(error of estimation) 估計誤差的來源有二:抽樣誤差與非抽樣誤差。,Ming-chi Chen,社會統計,Page.49,估計誤差,抽樣誤差 抽樣誤差是樣本統計量與相對應的母體參數間的差異。此種差異來自抽樣過程的機遇(chance),抽樣方法及推論方法的不同。

25、 非抽樣誤差 非抽樣誤差主要來自調查時的執行與事後在記錄、整理資料時所發生的錯誤。,Ming-chi Chen,社會統計,Page.50,估計誤差,Ming-chi Chen,社會統計,Page.51,簡單隨機抽樣,簡單隨機抽樣的意義 抽取樣本時,若所有可能抽出的樣本被抽出的機率均相等,則稱該抽樣方法為簡單隨機抽樣。 簡單隨機抽樣的實施方式 抽籤式 以亂數表抽取樣本 以電腦做隨機抽樣,Ming-chi Chen,社會統計,Page.52,母體參數與樣本統計量,母體參數 母體參數是描述母體資料特性的統計測量數,一般簡稱為參數或母數。參數是我們想要獲取的,是統計的核心。 樣本統計量 樣本統計量為樣

26、本的實數函數。 抽樣分配 樣本統計量為隨機樣本的函數,而隨機樣本是由n個隨機變數所組成的,故樣本統計量亦為一隨機變數,其機率分配稱為抽樣分配。,Ming-chi Chen,社會統計,Page.53,樣本平均數的抽樣分配,Ming-chi Chen,社會統計,Page.54,樣本平均數的抽樣分配,Ming-chi Chen,社會統計,Page.55,樣本平均數的抽樣分配,Ming-chi Chen,社會統計,Page.56,某國家五大區域過去一年的族群衝突次數,Ming-chi Chen,社會統計,Page.57,族群衝突次數的母體機率分配,Ming-chi Chen,社會統計,Page.58,

27、樣本平均數的抽樣分配,Ming-chi Chen,社會統計,Page.59,樣本平均數的機率分配,Ming-chi Chen,社會統計,Page.60,族群衝突次數的抽樣,Ming-chi Chen,社會統計,Page.61,族群衝突的樣本平均數,Ming-chi Chen,社會統計,Page.62,族群衝突的抽樣分配,Ming-chi Chen,社會統計,Page.63,族群衝突抽樣分配圖,Ming-chi Chen,社會統計,Page.64,研究助理年資的機率分配圖,Ming-chi Chen,社會統計,Page.65,研究助理年資的樣本空間,Ming-chi Chen,社會統計,Page

28、.66,研究助理年資的樣本平均數,Ming-chi Chen,社會統計,Page.67,研究助理年資的抽樣分配,Ming-chi Chen,社會統計,Page.68,研究助理年資抽樣分配圖,Ming-chi Chen,社會統計,Page.69,擲骰子出現點數的機率分配圖,Ming-chi Chen,社會統計,Page.70,擲骰子兩次的樣本平均數的機率分配,Ming-chi Chen,社會統計,Page.71,擲骰子兩次樣本平均數的機率分配圖,Ming-chi Chen,社會統計,Page.72,1-1,樣本平均數的期望值與變異數,Ming-chi Chen,社會統計,Page.73,1-1,

29、抽樣分配的變異數與標準差,Ming-chi Chen,社會統計,Page.74,大數法則,Ming-chi Chen,社會統計,Page.75,圖9.16 大數法則,Ming-chi Chen,社會統計,Page.76,大數法則,Ming-chi Chen,社會統計,Page.77,圖9.16 X 的機率分配與 的抽樣分配,Ming-chi Chen,社會統計,Page.78,The Central Limit Theorem,當母體為常態分配時,無論樣本數大小,樣本平均數的抽樣分配必為常態。 Suppose we select a random sample of n observation

30、s from any population having mean u and standard deviation . If n is sufficiently large (n=2030), the sampling distribution of X will be:,The approximation improves as the sample size increase.,Ming-chi Chen,社會統計,Page.79,圖9.18 中央極限定理 母體分配 母體分配,Ming-chi Chen,社會統計,Page.80,圖9.18 中央極限定理(續) 抽樣分配 抽樣分配,Min

31、g-chi Chen,社會統計,Page.81,圖9.18 中央極限定理(續) 抽樣分配 抽樣分配,Ming-chi Chen,社會統計,Page.82,表9.11 的抽樣分配,Ming-chi Chen,社會統計,Page.83,例題,(1) 某大班統計課學生期中考成績呈現常態分配,均數為72分,標準差為9分。隨機抽得某生,請問其分數超過80分的機率為何? (2) 任意抽取一個由10名學生所構成的樣本,請問這10名學生平均分數超過80分的機率為何?,Ming-chi Chen,社會統計,Page.84,例題,用SE來表示,Ming-chi Chen,社會統計,Page.85,例題,假設勞委會

32、要估計化工工程師的起薪。母體的平均數為u=$25,000,母體的標準差為$2,000。勞委會取n=100的隨機樣本,找出樣本平均數與母體平均數差距不會超過$400的機率? n=100, u=$25,000, =$2,000 因為n=10030,套用中央極限定律:,Ming-chi Chen,社會統計,Page.86,例題,樣本平均數與母體平均數差距不會超過$400,即X-bar介於24,60025,000之間。P(24,600 X-bar 25,400)=?,25000,25400,24600,Ming-chi Chen,社會統計,Page.87,Sampling distribution o

33、f the difference between two sample mean,假設有兩獨立母體,1,1,2,2,1,21/n1,2,22/n,Ming-chi Chen,社會統計,Page.88,Sampling distribution of the difference between two sample mean,當樣本n很大時,樣本平均數差之抽樣分配為近似常態分配,1,21/n1,2,22/n2,1- 2,Ming-chi Chen,社會統計,Page.89,Sampling distribution of the difference between two sample me

34、an,1- 2,Ming-chi Chen,社會統計,Page.90,例題,美國某發卡銀行風險分析師宣稱女性用卡人平均每月消費是80元美金,變異數是1400,而男性平均是80元,而變異數是1320元。取一個包含100女性用卡人和120位男性用卡人的樣本,請問女性樣本均數至少比男性高出5元的機率為何?,Ming-chi Chen,社會統計,Page.91,例題,Ming-chi Chen,社會統計,Page.92,例題,Ming-chi Chen,社會統計,Page.93,例題,Ming-chi Chen,社會統計,Page.94,例題,Ming-chi Chen,社會統計,Page.95,例題

35、,A牌液晶銀幕的平均壽命為6.5年,標準差為0.9年;B牌液晶螢幕平均壽命為6年,標準差為0.8年。我們從A牌中抽出36個樣本,從B牌抽出49個樣本,請問A牌的樣本平均壽命比B牌樣本平壽命長至少1年的機率?,Ming-chi Chen,社會統計,Page.96,例題,Ming-chi Chen,社會統計,Page.97,Sampling Distribution of the Sample Proportion,P是母體中所有具有某項特質的比例(失業、大學生) 為了要推測p,我們從母體中取一個大小為 n的樣本,計算其中有X個觀察值具有此項特質。 我們用樣本的比例 p = X/n來估算p。 q=

36、1-p,Ming-chi Chen,社會統計,Page.98,Sampling Distribution of the Sample Proportion,The Normal Approximation Rule for Proportion: If np5, and nq 5, the random variable p has approximately a normal distribution with:,Ming-chi Chen,社會統計,Page.99,Sampling Distribution of the Sample Proportion,If the distribut

37、ion of p is approximately normal, then random variable,Ming-chi Chen,社會統計,Page.100,例題,在選舉前,有55%的選民支持歐巴馬,假設我們任取n=400人的隨機樣本來預測歐巴馬的當選率,我們預測歐巴馬會輸的的機率為?,Ming-chi Chen,社會統計,Page.101,例題,Of your first 15 grandchildren, what is the chance there will be more than 10 boys? “more than 10 boys”the proportion of

38、boys is more than 10/15” Use the Normal Approximation Rule:,Ming-chi Chen,社會統計,Page.102,Sampling distribution of the difference between sample proportions,Suppose we take independent sample of size n1 and n2 from two population. Let p1 and p2 be the proportion of items in each population that posses

39、s a certain characteristics, and let q1=(1-p1), q2=(1-p2). If n1p15, n1q15, n2p25, n2q25, then the random variable (p1-p2) is approximately normally distributed with,Ming-chi Chen,社會統計,Page.103,例題,假設某行銷公司想要知道某電視節目在高、低收入人口中受歡迎的程度。假設高收入的人中有40%喜歡看此節目,在低收入人口中喜歡此節目的佔50%。這家行銷公司從高收入的人口中抽取100人的樣本,從低收入中抽200人的樣本。請問兩樣本比率差距小於.05的機率?,Ming-chi Chen,社會統計,Page.104,例題,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1