So erstellen sie ein pareto-diagramm in r (schritt für schritt)
Ein Pareto-Diagramm ist eine Art Diagramm, das die Häufigkeiten verschiedener Kategorien sowie die kumulativen Häufigkeiten der Kategorien anzeigt.
Dieses Tutorial bietet ein schrittweises Beispiel für die Erstellung eines Pareto-Diagramms in R.
Schritt 1: Erstellen Sie die Daten
Angenommen, wir führen eine Umfrage durch, bei der wir 350 verschiedene Personen bitten, ihre Lieblingsgetreidemarke zwischen den Marken A, B, C, D und E zu nennen.
Der folgende Datensatz zeigt die Gesamtstimmenzahl für jede Marke:
#createdata df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'), count=c(140, 97, 58, 32, 17, 6)) #viewdata df favorite count 1 to 140 2 B 97 3 C 58 4 D 32 5 E 17 6 F 6
Schritt 2: Erstellen Sie das Pareto-Diagramm
Um ein Pareto-Diagramm zur Visualisierung der Ergebnisse dieser Umfrage zu erstellen, können wir die Funktion pareto.chart() aus dem qcc- Paket verwenden:
library (qcc) #create Pareto chart pareto. chart (df$count) Pareto chart analysis for df$count Frequency Cum.Freq. Percentage Cum.Percent. A 140.000000 140.000000 40.000000 40.000000 B 97.000000 237.000000 27.714286 67.714286 C 58.000000 295.000000 16.571429 84.285714 D 32.000000 327.000000 9.142857 93.428571 E 17.000000 344.000000 4.857143 98.285714 F 6.000000 350.000000 1.714286 100.000000
Die Ausgabetabelle zeigt uns die Häufigkeit und die kumulative Häufigkeit jeder Marke. Zum Beispiel:
- Marke A Frequenz: 140 | Kumulierte Häufigkeit: 140
- Häufigkeit der Marke B: 97 | Kumulierte Häufigkeit von A, B: 237
- C-Markierungsfrequenz: 58 | Kumulierte Häufigkeit von A, B, C: 295
Und so weiter.
Schritt 3: Bearbeiten Sie das Pareto-Diagramm (optional)
Der folgende Code zeigt, wie Sie den Titel des Diagramms sowie die verwendete Farbpalette ändern:
pareto. chart (df$count, main=' Pareto Chart for Favorite Cereal Brands ', col=heat. colors ( length (df$count)))
Eine vollständige Liste der verfügbaren Farbpaletten finden Sie in diesem R-Farb-Spickzettel .
Zusätzliche Ressourcen
So erstellen Sie Häufigkeitstabellen in R
So erstellen Sie ein relatives Häufigkeitshistogramm in R
So berechnen Sie kumulative Summen in R