So zeichnen sie die verteilung der spaltenwerte in r auf
Sie können die folgenden Methoden verwenden, um eine Verteilung von Spaltenwerten in R darzustellen:
Methode 1: Zeichnen Sie die Werteverteilung mithilfe des Dichtediagramms auf
plot(density(df$my_column))
Methode 2: Zeichnen Sie die Werteverteilung mithilfe eines Histogramms auf
hist(df$my_column)
Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen verwendet wird
#create data frame df = data. frame (team=rep(c(' A ', ' B '), each= 10 ), points=c(3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8, 7, 8, 9, 12, 12, 12, 14, 15, 17)) #view data frame df team points 1 to 3 2 to 3 3 to 4 4 to 5 5 to 4 6 to 7 7 to 7 8 to 7 9 to 10 10 to 11 11 B 8 12 B 7 13 B 8 14 B 9 15 B 12 16 B 12 17 B 12 18 B 14 19 B 15 20 B 17
Beispiel 1: Zeichnen Sie die Werteverteilung mithilfe des Dichtediagramms auf
Der folgende Code zeigt, wie die Verteilung der Werte in der Punktespalte mithilfe eines Dichtediagramms dargestellt wird:
#plot distribution of values in points column
plot(density(df$points))
Diese Syntax erzeugt eine glatte Kurve, die die Werteverteilung einer Variablen zusammenfasst.
Beachten Sie, dass wir bei Bedarf auch den Titel, die Achsenbeschriftungen und die Linienfarbe im Dichtediagramm ändern können:
#plot distribution of values in points column plot(density(df$points), col=' red ', main=' Density Plot of Points ', xlab=' Points ')
Beispiel 2: Zeichnen Sie die Werteverteilung mithilfe eines Histogramms auf
Der folgende Code zeigt, wie die Verteilung der Werte in der Punktspalte mithilfe eines Histogramms dargestellt wird:
#plot distribution of values in points column using histogram
hist(df$points)
Ein Histogramm verwendet Balken, um die Häufigkeiten von Werten in der Punktspalte darzustellen, im Gegensatz zu einer glatten Linie, die die Form der Verteilung zusammenfasst.
Beachten Sie, dass wir auch den Titel, die Achsenbeschriftungen, die Farbe und die Anzahl der im Histogramm verwendeten Sprünge ändern können:
#plot distribution of values in points column using histogram hist(df$points, main=' Histogram of Points ', xlab=' Points ', col=' steelblue ', breaks= 12 )
Hinweis : Je größer der Wert ist, den Sie für das Argument „Breaks“ wählen, desto mehr Balken enthält das Histogramm.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:
So fügen Sie in R eine vertikale Linie zum Histogramm hinzu
So erstellen Sie Kerneldichtediagramme in R
So überlagern Sie Dichtediagramme in ggplot2