R でパレート図を作成する方法 (ステップバイステップ)
パレート図は、さまざまなカテゴリの度数とカテゴリの累積度数を表示するグラフの一種です。
このチュートリアルでは、R でパレート図を作成するステップバイステップの例を示します。
ステップ 1: データを作成する
350 人の異なる人々に、ブランド A、B、C、D、E の中からお気に入りのシリアル ブランドを特定するよう依頼するアンケートを実施するとします。
次のデータセットは、各ブランドの合計投票数を示しています。
#createdata df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'), count=c(140, 97, 58, 32, 17, 6)) #viewdata df favorite count 1 to 140 2 B 97 3 C 58 4 D 32 5 E 17 6 F 6
ステップ 2: パレート図を作成する
この調査の結果を視覚化するためのパレート図を作成するには、 qccパッケージのpareto.chart()関数を使用できます。
library (qcc) #create Pareto chart pareto. chart (df$count) Pareto chart analysis for df$count Frequency Cum.Freq. Percentage Cum.Percent. A 140.000000 140.000000 40.000000 40.000000 B 97.000000 237.000000 27.714286 67.714286 C 58.000000 295.000000 16.571429 84.285714 D 32.000000 327.000000 9.142857 93.428571 E 17.000000 344.000000 4.857143 98.285714 F 6.000000 350.000000 1.714286 100.000000
出力テーブルには、各ブランドの頻度と累積頻度が表示されます。例えば:
- ブランドA頻度: 140 |累積頻度: 140
- ブランド B 頻度: 97 | A、Bの累積頻度: 237
- Cマーク頻度: 58 | A、B、Cの累積頻度: 295
等々。
ステップ 3: パレート図を編集する (オプション)
次のコードは、グラフのタイトルと使用するカラー パレットを変更する方法を示しています。
pareto. chart (df$count, main=' Pareto Chart for Favorite Cereal Brands ', col=heat. colors ( length (df$count)))
利用可能なカラー パレットの完全なリストは、この R Color チートシートで見つけることができます。