R で四分位数を見つけて視覚化する方法


四分位数は、データセットを 4 つの等しい部分に分割する値です。

  • 最初の四分位は、データ セットの 25 パーセンタイルを表します。
  • 2 番目の四分位は、データ セットの 50 パーセンタイルを表します。この値は、データセットの中央値に相当します。
  • 3 番目の四分位は、データ セットの 75 パーセンタイルを表します。

quantile()関数を使用すると、R の特定のデータセットの四分位数を簡単に計算できます。

このチュートリアルでは、この機能を実際に使用する方法の例を示します。

R での四分位数の計算

次のコードは、R で指定されたデータセットの四分位を計算する方法を示しています。

 #define dataset
data = c(4, 7, 12, 13, 14, 15, 15, 16, 19, 23, 24, 25, 27, 28, 33)

#calculate quartiles of dataset
quantile(data)

  0% 25% 50% 75% 100% 
 4.0 13.5 16.0 24.5 33.0 

結果を解釈する方法は次のとおりです。

  • 最初の値はデータセット内の最小値を表示します: 4.0
  • 2 番目の値は、データセットの最初の四分位を表示します: 13.5
  • 3 番目の値は、データセットの 2 番目の四分位を表示します: 16.0
  • 4 番目の値は、データセットの 3 番目の四分位を表示します: 24.5
  • 5 番目の値は、データセット内の最大値を示します: 33.0

関連: R でパーセンタイルを簡単に計算する方法

R での四分位数の視覚化

boxplot()関数を使用して箱ひげ図を作成し、R でこのデータセットの四分位数を視覚化できます。

 #create boxplot
boxplot(data)

R で四分位数を視覚化する

箱ひげ図を解釈する方法は次のとおりです。

  • 一番下の「ひげ」には最小値4が表示されます。
  • ボックスの最下行には、最初の四分位値13.5が表示されます。
  • ボックスの中央の黒いバーには、第 2 四分位値16.0が表示されます。
  • ボックスの一番上の行には、第 3 四分位値24.5が表示されます。
  • 上の「ひげ」は最大値33.0を示しています。

このユニークなプロットは、データセット内の値の分布を迅速に視覚化するのに役立ちます。

関連: R で単一のグラフに複数の箱ひげ図をプロットする方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です