程式作者:Rebecca Su 資料來源:統計生活館
[優點] 最適宜提供資料的位置和分布之資訊
[缺點] 作法較繁瑣
[作法]
盒鬚圖又稱為箱形圖,其繪製須使用常用的統計量,最適宜提供有關資料的位置和分散的參考,尤其在不同的母體資料時更可表現其差異,首先介紹常用的統計量 :
。 平均數
。 中位數
。 百分位數
。 四分位數
。 全距
。 四分位距
。 變異數和標準差
。 盒鬚圖的繪製
- 平均數:
樣本平均數 ( 樣本統計量 ):
母體平均數 ( 母體參數 ):
基本上,樣本平均數即是樣本資料的『中心位置』
例如:
13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22
則
- 中位數:
資料經由遞增或遞減的排序後:
。 如果n為奇數,則中位數為中間值。
。 如果n為偶數,則中位數為中間兩個值的平均數。
注意:樣本平均數對極端值比樣本中位數對極端值來的敏感
如下例資料所示, 1 3 5 7 9 2 4 6 8 100 則中位數為 5.5,但平均數卻變為 14.5,相差很大。
例如: 12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31
中位數 : (32+33)/ 2 = 32.5- 百分位數:
第p 個樣本百分位數是某一個數值,使得樣本中有 p 部分的觀察值小於或等於 。
求第p 個百分位數的程序:
1. 將資料由小到大排序。
2. 計算第個位置
3. 。 假如 i 不為整數,則取下一個比i 還要大的值,即為第 p 個百分位數。
。 假如 i 為整數,則第p 個百分位數為第 i 和i+1的平均。
注意:第50個百分位數 = 中位數- 四分位數:
當將資料區分為4個部份,這些區分的點即稱為四分位數。
即為:
第一四分位數或第25個百分位數
第二四分位數或第50個百分位數
第三四分位數或第75個百分位數
例如:
12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31
第一個四分位數,故取第3和第4位數的平均
即Q1 = 29.5- 全距:
全距 = ( 資料的最大值 ) - ( 資料的最小值 )
例如:
甲班13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22 => 20
乙班12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31 => 20
注意:全距易受極端值的影響- 四分位距:
四分位距為第一個四分位數和第三個四分位數的差。
IQR = Q3 -Q1- 變異數和標準差:
母體的變異數即為母體離差的平方和
而樣本的變異數即為樣本離差的平方和
例如:
13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22
則 s2 = 33.42
- 盒鬚圖之繪製方法:
盒鬚圖即是提供下面五個常用的統計量,可以提供探討資料重要的位置和分散資訊
。 最小值
。 第一四分位數 Q1
。 中位數 Md
。 第三四分位數 Q3
。 最大值 Max
。 平均數
1. 簡易盒鬚圖
甲班 13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22
乙班 12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31
中間的*即是 平均數
2. 完整盒鬚圖
注意:資料在最小上限和最大上限之外稱為極端值。
全站熱搜
留言列表