三章叙述统计量.ppt

上传人:本田雅阁 文档编号:2625989 上传时间:2019-04-23 格式:PPT 页数:149 大小:825.01KB
返回 下载 相关 举报
三章叙述统计量.ppt_第1页
第1页 / 共149页
三章叙述统计量.ppt_第2页
第2页 / 共149页
三章叙述统计量.ppt_第3页
第3页 / 共149页
三章叙述统计量.ppt_第4页
第4页 / 共149页
三章叙述统计量.ppt_第5页
第5页 / 共149页
点击查看更多>>
资源描述

《三章叙述统计量.ppt》由会员分享,可在线阅读,更多相关《三章叙述统计量.ppt(149页珍藏版)》请在三一文库上搜索。

1、第三章 敘述統計量 陳順宇 教授 成功大學統計系 1 統計量 學習如何將資料轉變成一個(或幾個) 統計量, 如樣本平均數, 標準差s等, 但由於這種數是由樣本算出,因此也 稱為”樣本統計量”(Sample Statistic)或 簡稱統計量 2 3.1 3種不同型式的統計量 1.集中趨勢的統計量 2.位置的統計量 3.離勢的統計量 3 3.2 集中趨勢統計量 集中趨勢的統計量主要是決定資料的 “中心點”, 或是最能“代表”此組數據的數。 4 常用的統計量有 平均數(Mean), 中位數(Median), 眾數(Mode), 去頭尾平均數(Trimmed Mean),及 加權平均數(Weight

2、ed Mean) 5 樣本平均數樣本平均數 6 母體平均數母體平均數 7 例例3.1、 由某校抽樣 11位同學,每人 罰球投籃 10次,投中次數分別為 3 2 3 7 4 3 6 4 3 3 6 求樣本平均數=? 8 平均投中 4次 9 平均投中比例 10 例例3.2 、(例例1.9 續續) 抽樣 50位台南市 成年市民,求 (1) 50位市民樣本平均身高 (2) 男生的平均身高 (3) 女生的平均身高 。 11 50位市民的平均身高 12 25位男生平均身高 13 25位女生平均身高 14 例3.3、(例2.2續) 全班50位學生統計學期中考試成績 如表2.2, 求全班成績的母體平均數 15

3、 母體平均數 16 2.中位數 所謂中位數是資料從小排到大, 經排序後“最中間的數”, 也就是當資料有奇數個時, 中位數是排序最中間的數, 而當資料有偶數個時, 中位數為排序最中間的兩個數的平均。 17 大約有一半的數據小於或等於中位數 大約有一半的數據大於或等於中位數 中位數以Me表示 18 例3.4、(例3.1續) 求11位同學投中次數的中位數 19 中位數為3 2 3 3 3 3 3 4 4 6 6 7 20 例3.5、(例3.3續) 求全班50位學生統計學期中考試成績的 中位數? 21 中位數=62 50位學生的成績排序如表2.2, 中間位置為25.5, 因此以排序25的62分與排序2

4、6的62分的 平均 (62+62)/2=62 當做中位數 22 中位數中位數 23 3.眾數眾數 (Mode) 眾數就是資料中出現頻率最多的數 24 例3.6、(例3.1續) 求11位同學投中次數的眾數 25 眾數=3 11位同學投中次數頻率 最多的是投中 “3” 次,共出現 5 次, 因此 “3“就是此組資料的眾數 26 例3.7、(例3.3續) 求50位學生統計學期中考成績的眾數 27 眾數=60 在50位學生成績中,60分的有4位, 出現的次數最多, 所以60分即為此組資料的眾數 28 4.去頭尾平均數 去頭與去尾的筆數相等 且去掉的筆數為 ,其中n為樣本數。 例如n=32, =0.2(

5、即80%),則 去頭及去尾的筆數各為3筆,因 32 0.2/2=3.2=3 29 例3.8、(例3.1續) 求11位同學投中次數的 80%去頭尾平均數 30 去頭與去尾的筆數分別為 31 32 5.加權平均數 33 國文78分、英文 83分、 數學65分、理化 70分 地科75分、歷史 76分、 地理74分、公民 94分 則以上課時數加權的學年平均成績為: (5 78+5 83+5 65+3 70+3 75 +2 76+2 74+2 94)/27 = 2053/27 = 76.0370 34 3.3 位置統計量 位置的量測 百分位數(Percentile) 四分位數(Quartile) 35

6、p百分位數 36 例例3.11、(例例2.1續) (1)求全班成績的 85百分位數是多少 ? (2)求全班成績的 60百分位數是多少 ? 37 38 85百分位數 39 60百分位數 40 . 四分位數 Q1= 25百分位數 Q2= 50百分位數 =中位數 Q3= 75百分位數 41 例3.12、(例3.11續) 求Q1 , Q2 , Q3 42 43 3.4 離勢統計量 全距、 四分位距、 平均絕對偏差、 變異數、 標準差、 變異係數 44 全距全距 R 45 例3.13、(例3.1續) 求11位學生投中次數的全距 R= 7 2 =5 46 例3.14、(例3.3續) 求50位學生統計學期中

7、考成績的全距 R=9732 = 65 47 2. 四分位距 IQR = Q3Q1 48 例3.15、(例3.1續) 求11位學生投中次數的四分位距 IQR = Q3 Q1= 4 3 =1 49 例3.16、(例3.12續) 求50位學生統計學期中考成績的 四分位距 IQR= Q3Q1= 7454 = 20 50 平均絕對偏差 51 例3.17、(例3.1續 ) 求11位同學投中次數的絕對偏差 52 53 54 變異變異 變異變異 (Variation)是每一筆資料與 中心點差距 (稱為偏差 )的平方和, 即變異為偏差平方和 55 可證明 56 樣本變異數樣本變異數 57 母體變異數母體變異數

8、58 例例3.18、(例例3.1續) 求11位同學投中球數的變異及變異數 59 60 x的變異 61 例例3.19、(例例3.3續) 求全班 50位學生統計學期中考成績的 母體變異數 62 63 64 樣本標準差 65 母體標準差 66 甲乙兩人打靶 您會收那一位為徒 67 例例3.20、(例例3.18續) 求11位同學投中次數的標準差 68 69 例3.21、(例3.2續) 求50位台南市成年市民身高的 樣本變異數 與樣本標準差 70 樣本變異數 與樣本標準差 71 例例3.22、(例例3.19續) 求全班 50位學生統計學期中考成績的 母體標準差 72 73 母體標準差 74 變異係數變異

9、係數 75 76 身高與體重變異係數 77 例例3.23、某人想投資 甲、乙兩投資策略 78 79 對稱的直方圖 80 右偏的直方圖 81 左偏的直方圖 82 3.6 經驗法則與經驗法則與 謝比雪夫謝比雪夫 不等不等 式式 一組資料,算出樣本平均數及 樣本標準差 s後, 我們可能進一步問資料落在與平均數 相差兩個標準差以內的比例會是多少 ? 像這類問題, 經驗法則與謝比雪夫不 等式 (Chebyshevs Inequality)提供部份答 案 83 “鐘形“的資料, 經驗法則經驗法則 84 謝比雪夫 提供一個較 “粗糙 “的答案 ,但它對任何形態的資料分配都適 用 85 例例3.25、(例3.

10、10續) 試以 謝比雪夫 不等式及經驗法則 求資料落在與平均數相差 1個標準差以內、 2個標準差以內、 3個標準差以內, 所佔比例並與實際結果做比較 86 87 88 89 3.7相關係數 1. 經理想了解產品價格與銷售量 是否有相關? 2. 教育學者想了解 IQ成績與教學成績 是有相關? 3.醫生想了解人出生時的體重與壽命 是否有相關? 4. 房地產公司想了解房價與物價 是否有相關? 90 關係程度有多高? 要了解是否有相關, 最直接的方法便是畫散佈圖, 但有時除了要知道是否有相關外, 也想要知道關係程度有多高? 此即本節所要介紹的相關係數 91 樣本相關係數樣本相關係數 (簡稱相關係數相關

11、係數 ) 92 相關係數相關係數 93 例例3.26、 研究某產品定價 (x)(單位:元 )與銷售 量(y)(單位:箱 )的關係, 在12個地區做實驗, 結果資料如下: (實際價格為 x+50元) 94 產品廣告費(x)與銷售量(y) 資料 95 標準化法標準化法 96 97 五行合計法五行合計法 98 99 100 廣告費 (x)與銷售量 (y)相關係 數 101 例例3.27、10位學生的 數學(x)、統計(y)成績 102 數學、統計偏差與偏差乘積 103 平方和 104 數學與統計相關係數 105 資料標準化 106 數學與統計相關係數 107 (1) 由定義可以看出相關係數是純量 ,

12、 它的大小與單位無關 (或說相關係數是單位不變量)。 108 (2)由看出, 如果大部份 ,同向 (同正或同負 ) , 則r是正的。 反之,如果大部份反向(一正一負 ), 則 r是負的。 109 (3) r 0 表 x 值增加時, y值有增加的傾向; r 0 表 x值增加時, y 值有減少的傾向。 110 r =1 111 r = -1 112 r = 0.9 113 r = 0.5 114 r = -0.9 115 r = -0.5 116 r = 0 117 r = 0 U形曲線相關 118 正的曲線相關 119 負的曲線相關 120 相關係數相關係數 因果關係因果關係 變數間有 相關相關

13、 不一定有 因果關因果關 係係 121 例例3.28、離婚率與出國人數 122 (1) 試畫出離婚率對出國人數的散佈圖 ; (2) 求離婚率與出國人數的相關係數; (3) 試問離婚率與出國人數是否有因果 關係? 123 離婚率對出國人數的散佈圖 124 相關係數 r0.9225 125 如離婚率是因,出國人數是 果 即離婚率高低會影響出國人數, 這表示什麼? 它的意義可能是台灣地區 這幾年來離婚人數增加, 這些離婚的人 (或其親朋好友 ) 為了散心到國外,造成出國人數的增 加。 126 如出國人數是因,離婚率是 果 可能解釋是國人出國後, 看見外國人很開放,也就見異思遷, 回國後就和老伴離婚了

14、 127 事實上並非如此 過去幾年,台灣地區由於經濟的成長 , 國民所得的增加、社會的開放, 造成女性同胞經濟獨立,不需要靠長 期飯票,也有多餘的錢到國外旅遊, 128 所以這幾年來離婚率不斷地增加, 出國人數也不斷地增加,都是受第三 者(經濟成長 (GNP)等因素 )的影響所造 成, 離婚率與出國人數的相關是一種 間接相關 129 離婚率與 GNP 130 出國人數與 GNP 131 例例3.29、身高與髮長 132 身高對髮長的散佈圖 133 相關係數 r 0.81 134 髮長(y)對身高 (x)的散佈圖 135 頭髮長度有愈短的現象 此散佈圖仍呈現身高愈高的人, 頭髮長度有愈短的現象,

15、 事實上頭髮長度與身高並沒有關係, 它們都是受第三個變數性別的影響, 男生頭髮較短但身高較高, 女生頭髮較長,身高較矮。 136 20位女生平均身高 160.7公分, 平均髮長 25.2公分; 30位男生平均身高 172.4公分, 平均髮長 7.5公分 137 30位男生髮長對身高的散佈 圖 138 20位女生髮長對身高的散佈 圖 139 髮長與身高的關係是間接的 男生的髮長對身高散佈圖,看起來很 亂,表示髮長與身高無關(-0.23), 同樣的女生的髮長與身高的 相關係數也很低 (0.11)。 所以控制性別後,髮長與身高 就沒有相關了, 140 兩組相關 (或稱成對 )的資料 ,相加後其平均數

16、及標準差 (1)兩組資料相加的平均 = 兩組資料個 別平均再相加,對否? (2)兩組資料相加的標準差是否等於兩 組資料個別標準差的相加呢?對否? 141 1.統計量是由觀察資料組成 如平均數、標準差,會隨觀察(或抽 樣) 資料不同而得到不同的答案, 所以統計量是 “隨機變數隨機變數 ”, 142 2.統計量與參數的差異 前者是可算的,後者是“未知的 ”定數 ,統計量可用來 “估計 ”參數, 但估計會有誤差, 如何使誤差愈小愈好 是學習統計必須了解的。 143 3. “平均數 ”代表資料中心點 但有敏感性 (或稱不穩健性 ), 會受某些大數據的影響 144 4.了解標準差的意義, 何種情況下標準差愈大愈好 (如評分、區別等問題), 何種情況下標準差愈小愈好 (如品質問題 ) 145 5.右偏(或稱正偏 )分配時 平均數大於中位數。 146 6.做統計推論最主要的 兩個統計量是 樣本平均數與樣本變異數 147 7.資料分佈呈鐘形時, 經驗法則提供較精確的機率比例, 不知資料分佈形態時, 謝比雪夫 提供較粗糙的機率不等式 148 8.量測兩個變數線性相關程度的指標 為 相關係數, 但兩變數有相關一定有因果關係 149

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1