R で四分位範囲を計算する方法 (例付き)


四分位範囲は、データセットの第 1 四分位 (25 パーセンタイル) と第 3 四分位 (75 パーセンタイル) の間の差を表します。

簡単に言うと、値の中央の 50% の間の偏差を測定します。

IQR = 第 3 四半期 – 第 1 四半期

組み込みのIQR()関数を使用して、R の一連の値の四分位範囲を計算できます。

 IQR(x)

次の例は、この関数を実際に使用する方法を示しています。

例 1: ベクトルの四分位範囲

次のコードは、ベクトル内の値の四分位範囲を計算する方法を示しています。

 #definevector
x <- c(4, 6, 6, 7, 8, 12, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x)

[1] 14.5

例 2: 欠損値のあるベクトルの四分位範囲

ベクトルに欠損値がある場合は、四分位範囲を計算するときに欠損値を無視するために必ずna.rm=TRUEを指定してください。

 #define vector with some missing values
x <- c(4, 6, NA, 7, NA, NA, 15, 17, 20, 21, 21, 23, 24, 27, 28)

#calculate interquartile range of values in vector
IQR(x, na. rm = TRUE )

[1] 10.25

例 3: データ フレーム内の列の四分位範囲

次のコードは、データ フレーム内の特定の列の四分位範囲を計算する方法を示しています。

 #define data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1' column
IQR(df$var1)

[1] 1

例 4: データ フレーム内の複数の列の四分位範囲

次のコードは、データ フレーム内の複数の列の四分位範囲を計算する方法を示しています。

 #define data frame
df <- data. frame (var1=c(1, 3, 3, 4, 5),
                 var2=c(7, 7, 8, 3, 2),
                 var3=c(3, 3, 6, 6, 8),
                 var4=c(1, 1, 2, 8, 9))

#calculate interquartile range of 'var1', 'var2', and 'var4' columns
sapply(df[, c(' var1 ', ' var2 ', ' var4 ')], IQR)

var1 var2 var4 
   1 4 7

追加リソース

Rで範囲を見つける方法
R の標準偏差を計算する方法
四分位範囲を解釈する方法
四分位範囲と標準偏差: 違いは何ですか?

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です