Google スプレッドシート: 外れ値を除いた平均を計算します。


Google スプレッドシートで外れ値を除外しながら平均を計算するには、次の 2 つの方法があります。

1. TRIMMEAN を使用して外れ値を除外する

2. 四分位範囲を使用して外れ値を除外する

Google スプレッドシートで次のデータセットを使用して、両方の方法の使用方法を説明します。

方法 1: TRIMMEAN を使用して外れ値を除外する

TRIMMEAN関数は、データセットの上位と下位から一定の割合の観測値を除外しながら、値の範囲の平均を計算します。

たとえば、次の式を使用して、観測値の合計 20% (上位 10% と下位 10%) を除いた列 A の平均値を計算できます。

 =TRIMMEAN( A2:A16 , 20% )

データセットには 15 個の値があるため、10% は 1.5 に相当し、1 に四捨五入されます。

したがって、この式は、最小値と最大値を除いた範囲内の値の平均を計算します。

異常値を除いた Google スプレッドシートの平均

外れ値を除いた平均は58.30769であることがわかります。

方法 2: 四分位範囲を使用して外れ値を除外する

四分位範囲(IQR) は、データセット内の 75 パーセンタイル (Q3) と 25 パーセンタイル (Q1) の差です。値の平均 50% の分布を測定します。

観測値が第 3 四分位 (Q3) より上の四分位範囲の 1.5 倍、または第 1 四分位 (Q1) より下の四分位範囲の 1.5 倍である場合、その観測値を外れ値として定義できます。

次の式を使用して、Google スプレッドシートのデータセットの四分位範囲を計算できます。

 =QUARTILE( A2:A16,3 )-QUARTILE( A2:A16,1 )

次のスクリーンショットは、この式の使用方法を示しています。

次に、次の式を使用して IQR を使用して外れ値を特定し、データセット内の外れ値である値に「1」を割り当てることができます。

 =IF(OR( A2 <QUARTILE( $A$2:$A$16 ,1)-1.5* $B$18 , A2 >QUARTILE( $A$2:$A$16 ,3)+1.5* $B$18 ),1, 0)

次のスクリーンショットは、この式の使用方法を示しています。

外れ値であることが判明した唯一の値は164です。

最後に、次の式を使用して、データセット内の外れ値ではないすべての値の平均を計算できます。

 =AVERAGEIF( B2:B16 , 0, A2:A16 )

次のスクリーンショットは、この式の使用方法を示しています。

外れ値を除いた平均は55.42857であることがわかります。

追加リソース

次のチュートリアルでは、Google スプレッドシートで他の一般的なタスクを実行する方法を説明します。

Googleスプレッドシートでグループごとの平均を計算する方法
Googleスプレッドシートで平均パーセンテージを計算する方法
Googleスプレッドシートで加重平均を計算する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です