Kerneldichtheidsplots maken in r (met voorbeelden)
Een kerneldichtheidsplot is een type plot dat de verdeling van waarden in een dataset weergeeft met behulp van een doorlopende curve.
Een kerneldichtheidsgrafiek is vergelijkbaar met een histogram , maar is nog beter in het weergeven van de vorm van een verdeling, omdat deze niet wordt beïnvloed door het aantal bins dat in het histogram wordt gebruikt.
We kunnen de volgende methoden gebruiken om een kerneldichtheidsplot in R te maken:
Methode 1: Maak een dichtheidsgrafiek met één kernel
#define kernel density kd <- density(data) #create kernel density plot plot(kd)
Methode 2: Maak een gevuld kerneldichtheidsplot
#define kernel density kd <- density(data) #create kernel density plot plot(kd) #fill in kernel density plot with specific color polygon(kd, col=' blue ', border=' black ')
Methode 3: Maak meerdere kerneldichtheidsplots
#plot first kernel density plot kd1 <- density(data1) plot(kd1, col=' blue ') #plot second kernel density plot kd2 <- density(data2) lines(kd2, col=' red ') #plot third kernel density plot kd3 <- density(data3) lines(kd3, col=' purple ') ...
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken.
Methode 1: Maak een dichtheidsgrafiek met één kernel
De volgende code laat zien hoe u een kerneldichtheidsplot maakt voor een gegevensset in R:
#create data data <- c(3, 3, 4, 4, 5, 6, 7, 7, 7, 8, 12, 13, 14, 17, 19, 19) #define kernel density kd <- density(data) #create kernel density plot plot(kd, main=' Kernel Density Plot of Data ')
De x-as toont de waarden in de dataset en de y-as toont de relatieve frequentie van elke waarde. De hoogste punten op de grafiek geven aan waar waarden het vaakst voorkomen.
Methode 2: Maak een gevuld kerneldichtheidsplot
De volgende code laat zien hoe u een kerneldichtheidsplot maakt met een specifieke randkleur en vulkleur:
#create data data <- c(3, 3, 4, 4, 5, 6, 7, 7, 7, 8, 12, 13, 14, 17, 19, 19) #define kernel density kd <- density(data) #create kernel density plot plot(kd) #add color polygon(kd, col=' steelblue ', border=' black ')
Methode 3: Maak meerdere kerneldichtheidsplots
De volgende code laat zien hoe u meerdere kerneldichtheidsplots kunt maken in één plot in R:
#create datasets
data1 <- c(3, 3, 4, 4, 5, 6, 7, 7, 7, 8, 12, 13, 14, 17, 19, 19)
data2 <- c(12, 3, 14, 14, 4, 5, 6, 10, 14, 7, 7, 8, 10, 12, 17, 20)
#plot first kernel density plot
kd1 <- density(data1)
plot(kd1, col=' blue ', lwd= 2 )
#plot second kernel density plot
kd2 <- density(data2)
lines(kd2, col=' red ', lwd= 2 )
Merk op dat we een vergelijkbare syntaxis kunnen gebruiken om zoveel kerneldichtheidsplots te maken als we willen in een enkele grafiek.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende plots in R kunt maken:
Hoe meerdere boxplots in R te plotten
Hoe meerdere histogrammen in R te plotten
Hoe teken je meerdere lijnen in R