程式作者:Rebecca Su     資料來源:統計生活館
[優點] 最適宜提供資料的位置和分布之資訊
[缺點] 作法較繁瑣
[作法] 
盒鬚圖又稱為箱形圖,其繪製須使用常用的統計量,最適宜提供有關資料的位置和分散的參考,尤其在不同的母體資料時更可表現其差異,首先介紹常用的統計量 : 
 。 平均數 
 。 中位數 
 。 百分位數 
 。 四分位數 
 。 全距 
 。 四分位距 
 。 變異數和標準差 
 。 盒鬚圖的繪製 
 
  1. 平均數:
    樣本平均數 ( 樣本統計量 ): 
     
    母體平均數 ( 母體參數 ): 
      
    基本上,樣本平均數即是樣本資料的『中心位置』 
    例如:
    13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22 
    則  

  2. 中位數: 
    資料經由遞增或遞減的排序後: 
    。 如果n為奇數,則中位數為中間值。 
    。 如果n為偶數,則中位數為中間兩個值的平均數。 
    注意:樣本平均數對極端值比樣本中位數對極端值來的敏感
    如下例資料所示, 1 3 5 7 9 2 4 6 8 100 則中位數為 5.5,但平均數卻變為 14.5,相差很大。 
    例如: 12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31 
    中位數 : (32+33)/ 2 = 32.5 

  3. 百分位數: 
    第p 個樣本百分位數是某一個數值,使得樣本中有 p 部分的觀察值小於或等於 。 
    求第p 個百分位數的程序: 
    1. 將資料由小到大排序。 
    2. 計算第個位置
    3. 。 假如 i 不為整數,則取下一個比i 還要大的值,即為第 p 個百分位數。
     。 假如 i 為整數,則第p 個百分位數為第 i 和i+1的平均。 
    注意:第50個百分位數 = 中位數 

  4. 四分位數: 
    當將資料區分為4個部份,這些區分的點即稱為四分位數。
    即為:
     *第一四分位數或第25個百分位數
     第二四分位數或第50個百分位數
     第三四分位數或第75個百分位數 
    例如: 
     12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31 
     第一個四分位數,故取第3和第4位數的平均 
     即Q1 = 29.5 

  5. 全距: 
    全距 = ( 資料的最大值 ) - ( 資料的最小值 ) 
    例如:
     甲班13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22 => 20 
     乙班12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31   => 20 
    注意:全距易受極端值的影響

  6. 四分位距: 
    四分位距為第一個四分位數和第三個四分位數的差。 
    IQR = Q3 -Q1

  7. 變異數和標準差: 
    母體的變異數即為母體離差的平方和
      
    而樣本的變異數即為樣本離差的平方和
       
    例如:
     13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22 
     
     則 s33.42 

  8. 盒鬚圖之繪製方法: 
    盒鬚圖即是提供下面五個常用的統計量,可以提供探討資料重要的位置和分散資訊
      。 最小值 
      。 第一四分位數 Q1
      。 中位數 Md
      。 第三四分位數 Q3
      。 最大值 Max
      。 平均數 
    1. 簡易盒鬚圖
     甲班 13個同學的考試成績: 39 32 20 34 40 33 31 29 25 30 31 32 22 
     乙班 12個同學的考試成績: 33 30 36 45 34 28 25 32 29 34 35 31 
      
     中間的*即是 平均數 

    2. 完整盒鬚圖 
      
     注意:資料在最小上限和最大上限之外稱為極端值。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 csp92 的頭像
    csp92

    人生七十古來稀

    csp92 發表在 痞客邦 留言(0) 人氣()