R で四分位数を見つけて視覚化する方法
四分位数は、データセットを 4 つの等しい部分に分割する値です。
- 最初の四分位は、データ セットの 25 パーセンタイルを表します。
- 2 番目の四分位は、データ セットの 50 パーセンタイルを表します。この値は、データセットの中央値に相当します。
- 3 番目の四分位は、データ セットの 75 パーセンタイルを表します。
quantile()関数を使用すると、R の特定のデータセットの四分位数を簡単に計算できます。
このチュートリアルでは、この機能を実際に使用する方法の例を示します。
R での四分位数の計算
次のコードは、R で指定されたデータセットの四分位を計算する方法を示しています。
#define dataset data = c(4, 7, 12, 13, 14, 15, 15, 16, 19, 23, 24, 25, 27, 28, 33) #calculate quartiles of dataset quantile(data) 0% 25% 50% 75% 100% 4.0 13.5 16.0 24.5 33.0
結果を解釈する方法は次のとおりです。
- 最初の値はデータセット内の最小値を表示します: 4.0
- 2 番目の値は、データセットの最初の四分位を表示します: 13.5
- 3 番目の値は、データセットの 2 番目の四分位を表示します: 16.0
- 4 番目の値は、データセットの 3 番目の四分位を表示します: 24.5
- 5 番目の値は、データセット内の最大値を示します: 33.0
R での四分位数の視覚化
boxplot()関数を使用して箱ひげ図を作成し、R でこのデータセットの四分位数を視覚化できます。
#create boxplot
boxplot(data)
箱ひげ図を解釈する方法は次のとおりです。
- 一番下の「ひげ」には最小値4が表示されます。
- ボックスの最下行には、最初の四分位値13.5が表示されます。
- ボックスの中央の黒いバーには、第 2 四分位値16.0が表示されます。
- ボックスの一番上の行には、第 3 四分位値24.5が表示されます。
- 上の「ひげ」は最大値33.0を示しています。
このユニークなプロットは、データセット内の値の分布を迅速に視覚化するのに役立ちます。