Google スプレッドシート: 外れ値を除いた平均を計算します。
Google スプレッドシートで外れ値を除外しながら平均を計算するには、次の 2 つの方法があります。
1. TRIMMEAN を使用して外れ値を除外する
2. 四分位範囲を使用して外れ値を除外する
Google スプレッドシートで次のデータセットを使用して、両方の方法の使用方法を説明します。
方法 1: TRIMMEAN を使用して外れ値を除外する
TRIMMEAN関数は、データセットの上位と下位から一定の割合の観測値を除外しながら、値の範囲の平均を計算します。
たとえば、次の式を使用して、観測値の合計 20% (上位 10% と下位 10%) を除いた列 A の平均値を計算できます。
=TRIMMEAN( A2:A16 , 20% )
データセットには 15 個の値があるため、10% は 1.5 に相当し、1 に四捨五入されます。
したがって、この式は、最小値と最大値を除いた範囲内の値の平均を計算します。
外れ値を除いた平均は58.30769であることがわかります。
方法 2: 四分位範囲を使用して外れ値を除外する
四分位範囲(IQR) は、データセット内の 75 パーセンタイル (Q3) と 25 パーセンタイル (Q1) の差です。値の平均 50% の分布を測定します。
観測値が第 3 四分位 (Q3) より上の四分位範囲の 1.5 倍、または第 1 四分位 (Q1) より下の四分位範囲の 1.5 倍である場合、その観測値を外れ値として定義できます。
次の式を使用して、Google スプレッドシートのデータセットの四分位範囲を計算できます。
=QUARTILE( A2:A16,3 )-QUARTILE( A2:A16,1 )
次のスクリーンショットは、この式の使用方法を示しています。
次に、次の式を使用して IQR を使用して外れ値を特定し、データセット内の外れ値である値に「1」を割り当てることができます。
=IF(OR( A2 <QUARTILE( $A$2:$A$16 ,1)-1.5* $B$18 , A2 >QUARTILE( $A$2:$A$16 ,3)+1.5* $B$18 ),1, 0)
次のスクリーンショットは、この式の使用方法を示しています。
外れ値であることが判明した唯一の値は164です。
最後に、次の式を使用して、データセット内の外れ値ではないすべての値の平均を計算できます。
=AVERAGEIF( B2:B16 , 0, A2:A16 )
次のスクリーンショットは、この式の使用方法を示しています。
外れ値を除いた平均は55.42857であることがわかります。
追加リソース
次のチュートリアルでは、Google スプレッドシートで他の一般的なタスクを実行する方法を説明します。
Googleスプレッドシートでグループごとの平均を計算する方法
Googleスプレッドシートで平均パーセンテージを計算する方法
Googleスプレッドシートで加重平均を計算する方法