Kerneldichtheidsplots maken in r (met voorbeelden)


Een kerneldichtheidsplot is een type plot dat de verdeling van waarden in een dataset weergeeft met behulp van een doorlopende curve.

Een kerneldichtheidsgrafiek is vergelijkbaar met een histogram , maar is nog beter in het weergeven van de vorm van een verdeling, omdat deze niet wordt beïnvloed door het aantal bins dat in het histogram wordt gebruikt.

We kunnen de volgende methoden gebruiken om een kerneldichtheidsplot in R te maken:

Methode 1: Maak een dichtheidsgrafiek met één kernel

 #define kernel density
kd <- density(data)

#create kernel density plot
plot(kd)

Methode 2: Maak een gevuld kerneldichtheidsplot

 #define kernel density
kd <- density(data)

#create kernel density plot
plot(kd)

#fill in kernel density plot with specific color
polygon(kd, col=' blue ', border=' black ')

Methode 3: Maak meerdere kerneldichtheidsplots

 #plot first kernel density plot
kd1 <- density(data1)
plot(kd1, col=' blue ')

#plot second kernel density plot
kd2 <- density(data2)
lines(kd2, col=' red ')

#plot third kernel density plot
kd3 <- density(data3)
lines(kd3, col=' purple ')

...

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken.

Methode 1: Maak een dichtheidsgrafiek met één kernel

De volgende code laat zien hoe u een kerneldichtheidsplot maakt voor een gegevensset in R:

 #create data
data <- c(3, 3, 4, 4, 5, 6, 7, 7, 7, 8, 12, 13, 14, 17, 19, 19)

#define kernel density
kd <- density(data)

#create kernel density plot
plot(kd, main=' Kernel Density Plot of Data ') 

De x-as toont de waarden in de dataset en de y-as toont de relatieve frequentie van elke waarde. De hoogste punten op de grafiek geven aan waar waarden het vaakst voorkomen.

Methode 2: Maak een gevuld kerneldichtheidsplot

De volgende code laat zien hoe u een kerneldichtheidsplot maakt met een specifieke randkleur en vulkleur:

 #create data
data <- c(3, 3, 4, 4, 5, 6, 7, 7, 7, 8, 12, 13, 14, 17, 19, 19)

#define kernel density
kd <- density(data)

#create kernel density plot
plot(kd)

#add color
polygon(kd, col=' steelblue ', border=' black ')

Methode 3: Maak meerdere kerneldichtheidsplots

De volgende code laat zien hoe u meerdere kerneldichtheidsplots kunt maken in één plot in R:

 #create datasets
data1 <- c(3, 3, 4, 4, 5, 6, 7, 7, 7, 8, 12, 13, 14, 17, 19, 19)
data2 <- c(12, 3, 14, 14, 4, 5, 6, 10, 14, 7, 7, 8, 10, 12, 17, 20)

#plot first kernel density plot
kd1 <- density(data1)
plot(kd1, col=' blue ', lwd= 2 )

#plot second kernel density plot
kd2 <- density(data2)
lines(kd2, col=' red ', lwd= 2 ) 

Merk op dat we een vergelijkbare syntaxis kunnen gebruiken om zoveel kerneldichtheidsplots te maken als we willen in een enkele grafiek.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende plots in R kunt maken:

Hoe meerdere boxplots in R te plotten
Hoe meerdere histogrammen in R te plotten
Hoe teken je meerdere lijnen in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert