2020年2月18日 星期二

中位平均數

https://4rdp.blogspot.com/2020/02/blog-post.html

這個中位平均方法是 Andy 自己發想的,計算方法如下:

假設有 11 筆資料,先將它們大小排序,例如 100, 100, 95, 90, 85, 80, 75, 70, 60, 50, 10
然後給這些數據排序加權,1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1,加權值從 1 開始,依序加 1,中位數的加權最大
加權合計 = 100x1 + 100x2 + 95x3 + 90x4 + 85x5 + 80x6 + 75x5 + 70x4 + 60x3 + 50x2 + 10x1 = 2795
中位平均數 = 2795 / (1+2+3+4+5+6+5+4+3+2+1) = 77.64

算術平均數 = (100+100+95+90+85+80+75+70+60+50+10) / 11 = 815 / 11 = 74.09

中位數 = 80

Andy 現在還是高中生,對成績相當敏感,覺得成績計算平均值會失真,如果只有少數同學高分或是低分,都會對總體平均分數產生影響,雖然中位數是比較接近整體樣本中間值,但是它也顯現不出極端數值的些許影響,此外,Andy 不喜歡標準差,雖然這搭配平均數可以知道整體分布狀況,但是覺得麻煩,所以他想出這個中位與平均方法的合體,Andy 沒有幫這方法命名,所以我幫忙命名。

個人覺得這方法挺麻煩的,首先要將所有資料數值排序,然後再加權合計,最後取平均,複雜度不下標準差,樣本數不多時還好,成千上萬筆資料就蠻傷腦筋,不過它確實比較貼近數據分佈狀況。

沒有留言:

張貼留言