R でパレート図を作成する方法 (ステップバイステップ)


パレート図は、さまざまなカテゴリの度数とカテゴリの累積度数を表示するグラフの一種です。

R のパレート図

このチュートリアルでは、R でパレート図を作成するステップバイステップの例を示します。

ステップ 1: データを作成する

350 人の異なる人々に、ブランド A、B、C、D、E の中からお気に入りのシリアル ブランドを特定するよう依頼するアンケートを実施するとします。

次のデータセットは、各ブランドの合計投票数を示しています。

 #createdata
df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'),
                 count=c(140, 97, 58, 32, 17, 6))

#viewdata
df

  favorite count
1 to 140
2 B 97
3 C 58
4 D 32
5 E 17
6 F 6

ステップ 2: パレート図を作成する

この調査の結果を視覚化するためのパレート図を作成するには、 qccパッケージのpareto.chart()関数を使用できます。

 library (qcc)

#create Pareto chart
pareto. chart (df$count)

Pareto chart analysis for df$count
     Frequency Cum.Freq. Percentage Cum.Percent.
  A 140.000000 140.000000 40.000000 40.000000
  B 97.000000 237.000000 27.714286 67.714286
  C 58.000000 295.000000 16.571429 84.285714
  D 32.000000 327.000000 9.142857 93.428571
  E 17.000000 344.000000 4.857143 98.285714
  F 6.000000 350.000000 1.714286 100.000000

出力テーブルには、各ブランドの頻度と累積頻度が表示されます。例えば:

  • ブランドA頻度: 140 |累積頻度: 140
  • ブランド B 頻度: 97 | A、Bの累積頻度: 237
  • Cマーク頻度: 58 | A、B、Cの累積頻度: 295

等々。

ステップ 3: パレート図を編集する (オプション)

次のコードは、グラフのタイトルと使用するカラー パレットを変更する方法を示しています。

 pareto. chart (df$count,
             main=' Pareto Chart for Favorite Cereal Brands ',
             col=heat. colors ( length (df$count))) 

R のパレート図

利用可能なカラー パレットの完全なリストは、この R Color チートシートで見つけることができます。

追加リソース

R で度数表を作成する方法
R で相対頻度ヒストグラムを作成する方法
R で累積和を計算する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です