So erstellen sie ein balkendiagramm in r


Ein Streifendiagramm ist eine Art Diagramm, das numerische Daten entlang eines einzelnen Bandes anzeigt. Ähnlich wie Boxplots können Balkendiagramme dabei helfen, die Verteilung von Daten zu visualisieren. Bei kleinen Stichprobengrößen können Balkendiagramme eine gute Alternative zu Boxplots sein, sodass Sie einzelne Datenpunkte sehen können.

In diesem Tutorial wird erläutert, wie Sie mithilfe der integrierten Funktion „stripchart()“ ein Streifendiagramm in R erstellen.

Die Funktion „stripchart()“.

Die grundlegende Syntax zum Erstellen eines Balkendiagramms in R lautet:

Stripchart(x, method, jitter, main, xlab, ylab, col, pch, Vertical, group.names)

  • x : ein numerischer Vektor oder eine Liste numerischer Vektoren zum Plotten. Dies ist das einzige Argument, das zur Erstellung einer Handlung erforderlich ist.
  • Methode : Die Methode, die zum Trennen von Punkten mit identischen Werten verwendet wird. Die Standardmethode „Overplot“ führt dazu, dass diese Punkte überplottet werden, es ist jedoch möglich, „Jitter“ anzugeben, um die Punkte zu jittern, oder „Stack“, um die Punkte zu stapeln.
  • Jitter : Wenn method = „jitter“ verwendet wird, gibt dies die Menge des anzuwendenden Jitters an.
  • main: Diagrammtitel
  • xlab : X-Achsen-Beschriftung
  • ylab : Y-Achsenbeschriftung
  • col : Farbe der Plotpunkte
  • pch : Form der Plotpunkte
  • vertikal : Wenn vertikal „TRUE“ ist, wird der Pfad standardmäßig vertikal und nicht horizontal gezeichnet
  • group.names : Gruppenbeschriftungen, die neben dem Plot gedruckt werden, wenn mehrere numerische Vektoren geplottet werden.

Balkendiagramm für einen einzelnen digitalen Vektor

Im folgenden Beispiel wird der eingebettete R-Datensatz Iris verwendet, um ein Balkendiagramm für einen einzelnen numerischen Vektor zu erstellen.

 #view first six rows of iris dataset
head(iris)

# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1 5.1 3.5 1.4 0.2 setosa
#2 4.9 3.0 1.4 0.2 setosa
#3 4.7 3.2 1.3 0.2 setosa
#4 4.6 3.1 1.5 0.2 setosa
#5 5.0 3.6 1.4 0.2 setosa
#6 5.4 3.9 1.7 0.4 setosa

Der folgende Code erstellt ein Basisbanddiagramm für die Variable Sepal.Length :

 stripchart(iris$Sepal.Length)

Wir können auch zusätzliche Argumente hinzufügen, um einen Titel und eine Beschriftung auf der x-Achse hinzuzufügen, die Farbe der Punkte zu ändern, die Form der Punkte zu ändern und die „Jitter“-Methode zu verwenden, damit sich einzelne Punkte nicht überlappen:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
           method = 'jitter')

Anstatt die Punkte zu vermischen, können wir sie „stapeln“:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
method = 'stack' )

Wir können das Diagramm auch vertikal statt standardmäßig horizontal anzeigen und die Achsenbeschriftung so ändern, dass sie auf der y-Achse liegt:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
ylab = 'Sepal Length' ,
           col = 'red',
           pch = 1,
           method = 'jitter',
vertical = TRUE )

Balkendiagramm für mehrere numerische Vektoren

Wir können auch mehrere Streifendiagramme in einem einzigen Diagramm zeichnen, indem wir eine Liste numerischer Vektoren übergeben.

Der folgende Code erstellt eine Liste mit den Variablen Sepallänge und -breite im Irisdatensatz und erstellt ein Balkendiagramm für jede Variable in einem einzelnen Diagramm:

 #create list of variables
x <- list('Sepal Length' = iris$Sepal.Length, 'Sepal Width' = iris$Sepal.Width)

#create plot that contains one strip chart per variable
stripchart(x,
           main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter')

Genau wie im vorherigen Beispiel können wir die Balkendiagramme auch vertikal statt standardmäßig horizontal zeichnen:

 stripchart(x, main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter',
vertical = TRUE )

Darüber hinaus können wir eine Formel der Form y~x an die Funktion stripchart() übergeben, wobei y ein numerischer Vektor ist, der nach dem Wert von x gruppiert ist.

Im Iris- Datensatz könnten wir beispielsweise die Daten nach Arten gruppieren, die drei unterschiedliche Werte haben („setosa“, „versicolor“ und „virginica“) und dann die Kelchblattlänge für jede Art in einem Balkendiagramm darstellen:

 stripchart(Sepal.Length ~ Species,
           data = iris,
           main = 'Sepal Length by Species',
           xlab = 'Species', 
           ylab = 'Sepal Length',
           col = c('steelblue', 'coral2', 'purple'),
           pch = 16,
           method = 'jitter',
           vertical = TRUE)

Um die vollständige Dokumentation für die Funktion „stripchart()“ in R anzuzeigen, geben Sie einfach Folgendes ein:

 ?stripchart

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert