Boxplots in r herschikken (met voorbeelden)
Vaak wilt u boxplots in R herschikken.
De volgende voorbeelden laten zien hoe u dit op twee verschillende manieren kunt doen:
- Methode 1: Herschikken op basis van een specifieke volgorde
- Methode 2: Herschikken op basis van de mediaanwaarde van de boxplot
In elk voorbeeld wordt de ingebouwde gegevensset voor luchtkwaliteit in R gebruikt:
#view first six lines of air quality data
head(airquality)
Ozone Solar.R Wind Temp Month Day
1 41 190 7.4 67 5 1
2 36 118 8.0 72 5 2
3 12 149 12.6 74 5 3
4 18 313 11.5 62 5 4
5 NA NA 14.3 56 5 5
6 28 NA 14.9 66 5 6
Dit is hoe een meervoudige boxplotplot voor deze dataset eruit zal zien zonder een volgorde op te geven:
#create boxplot that shows distribution of temperature by month
boxplot(Temp~Month, data=airquality, col=" lightblue ", border=" black ")
Voorbeeld 1: Boxplots herschikken op basis van een specifieke volgorde
De volgende code laat zien hoe u de boxplots sorteert op basis van de volgende volgorde voor de maandvariabele : 5, 8, 6, 9, 7.
#reorder Month values
airquality$Month <- factor(airquality$Month , levels =c(5, 8, 6, 9, 7))
#create boxplot of temperatures by month using the order we specified
boxplot(Temp~Month, data=airquality, col=" lightblue ", border=" black ")
Merk op dat de boxplots nu verschijnen in de volgorde die we hebben opgegeven met het argument niveaus .
Gerelateerd: Hoe factorniveaus in R te herschikken
Voorbeeld 2: Boxplots herschikken op basis van de mediaanwaarde
De volgende code laat zien hoe u de boxplots in oplopende volgorde kunt rangschikken op basis van de gemiddelde temperatuurwaarde voor elke maand:
#reorder Month values in ascending order based on median value of Temp
airquality$Month <- with(airquality, reorder(Month, Temp, median, na. rm = T ))
#create boxplot of temperatures by month
boxplot(Temp~Month, data=airquality, col=" lightblue ", border=" black ")
Boxplots verschijnen nu in oplopende volgorde op basis van de mediaanwaarde voor elke maand.
Opmerking : de mediaanwaarde van elke boxplot is de horizontale zwarte lijn die door het midden van elke box loopt.
We kunnen de boxplots ook in aflopende volgorde ordenen door een negatief teken voor Temp te gebruiken in de herschikkingsfunctie :
#reorder Month values in descending order based on median value of Temp
airquality$Month <- with(airquality, reorder(Month, -Temp, median, na. rm = T ))
#create boxplot of temperatures by month
boxplot(Temp~Month, data=airquality, col=" lightblue ", border=" black ")
Boxplots verschijnen nu in aflopende volgorde op basis van de mediaanwaarde voor elke maand.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in R kunt uitvoeren:
Hoe meerdere boxplots in R te plotten
Hoe u horizontale boxplots maakt in R
Hoe uitbijters in boxplots in R te verwijderen