R で四分位範囲を計算する方法 (例付き)
四分位範囲は、データセットの第 1 四分位 (25 パーセンタイル) と第 3 四分位 (75 パーセンタイル) の間の差を表します。
簡単に言うと、値の中央の 50% の間の偏差を測定します。
IQR = 第 3 四半期 – 第 1 四半期
組み込みのIQR()関数を使用して、R の一連の値の四分位範囲を計算できます。
IQR(x)
次の例は、この関数を実際に使用する方法を示しています。
例 1: ベクトルの四分位範囲
次のコードは、ベクトル内の値の四分位範囲を計算する方法を示しています。
#definevector x <- c(4, 6, 6, 7, 8, 12, 15, 17, 20, 21, 21, 23, 24, 27, 28) #calculate interquartile range of values in vector IQR(x) [1] 14.5
例 2: 欠損値のあるベクトルの四分位範囲
ベクトルに欠損値がある場合は、四分位範囲を計算するときに欠損値を無視するために必ずna.rm=TRUEを指定してください。
#define vector with some missing values x <- c(4, 6, NA, 7, NA, NA, 15, 17, 20, 21, 21, 23, 24, 27, 28) #calculate interquartile range of values in vector IQR(x, na. rm = TRUE ) [1] 10.25
例 3: データ フレーム内の列の四分位範囲
次のコードは、データ フレーム内の特定の列の四分位範囲を計算する方法を示しています。
#define data frame df <- data. frame (var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #calculate interquartile range of 'var1' column IQR(df$var1) [1] 1
例 4: データ フレーム内の複数の列の四分位範囲
次のコードは、データ フレーム内の複数の列の四分位範囲を計算する方法を示しています。
#define data frame df <- data. frame (var1=c(1, 3, 3, 4, 5), var2=c(7, 7, 8, 3, 2), var3=c(3, 3, 6, 6, 8), var4=c(1, 1, 2, 8, 9)) #calculate interquartile range of 'var1', 'var2', and 'var4' columns sapply(df[, c(' var1 ', ' var2 ', ' var4 ')], IQR) var1 var2 var4 1 4 7