So zeichnen sie mehrere boxplots in einem einzigen diagramm in r
Ein Boxplot (manchmal auch Box-and-Whisker-Plot genannt) ist ein Diagramm, das die fünfstellige Zusammenfassung eines Datensatzes zeigt.
Die fünfstellige Zusammenfassung umfasst:
- Der Mindestwert
- Das erste Quartil
- Der Medianwert
- Das dritte Quartil
- Der Maximalwert
In diesem Tutorial wird erklärt, wie Sie mit Base R und ggplot2 mehrere Boxplots in einem einzigen Plot in R zeichnen.
R-basierte Boxplots
Um zu veranschaulichen, wie Boxplots in R erstellt werden, arbeiten wir mit dem in R integrierten Luftqualitätsdatensatz :
#view first 6 rows of "air quality" dataset
head(airquality)
#Ozone Solar.R Wind Temp Month Day
#1 41 190 7.4 67 5 1
#2 36 118 8.0 72 5 2
#3 12 149 12.6 74 5 3
#4 18 313 11.5 62 5 4
#5 NA NA 14.3 56 5 5
#6 28 NA 14.9 66 5 6
Um einen einzelnen Boxplot für die Variable „Ozone“ zu erstellen, können wir die folgende Syntax verwenden:
#create boxplot for the variable “Ozone”
boxplot(airquality$Ozone)
Dies erzeugt den folgenden Boxplot:
Angenommen, wir möchten stattdessen für jeden Monat im Datensatz ein Boxplot erstellen. Die folgende Syntax zeigt, wie das geht:
#create boxplot that displays temperature distribution for each month in the dataset
boxplot(Temp~Month,
data=airquality,
main="Temperature Distribution by Month",
xlab="Month",
ylab="Degrees (F)",
col="steelblue",
border="black"
)
Dadurch wird das folgende Diagramm generiert, das für jeden Monat ein Boxplot anzeigt:
Boxplots in ggplot2
Eine andere Möglichkeit, Boxplots in R zu erstellen, ist die Verwendung des Pakets ggplot2 . Für die folgenden Beispiele verwenden wir erneut den integrierten Luftqualitätsdatensatz .
Um ein einzelnes Boxplot für die Variable „Ozon“ im Luftqualitätsdatensatz zu erstellen, können wir die folgende Syntax verwenden:
#create boxplot for the variable “Ozone”
library(ggplot2)
ggplot(data = airquality, aes(y=Ozone)) + geom_boxplot()
Dies erzeugt den folgenden Boxplot:
Wenn wir stattdessen für jeden Monat im Datensatz ein Boxplot erstellen möchten, können wir dazu die folgende Syntax verwenden:
#create boxplot that displays temperature distribution for each month in the dataset
library(ggplot2)
ggplot(data = airquality, aes(x=as.character(Month), y=Temp)) +
geom_boxplot(fill="steelblue") +
labs(title="Temperature Distribution by Month", x="Month", y="Degrees (F)")
Dadurch wird das folgende Diagramm generiert, das für jeden Monat ein Boxplot anzeigt:
Zusätzliche Ressourcen
Die folgenden Tutorials bieten zusätzliche Informationen zu Boxplots:
Wann sollten Sie einen Boxplot verwenden? (3 Szenarien)
So identifizieren Sie Asymmetrie in Boxplots
So vergleichen Sie Boxplots