Hoe de verdeling van kolomwaarden in r te plotten
U kunt de volgende methoden gebruiken om een verdeling van kolomwaarden in R te plotten:
Methode 1: Teken de verdeling van waarden met behulp van de dichtheidsplot
plot(density(df$my_column))
Methode 2: Teken de verdeling van waarden met behulp van een histogram
hist(df$my_column)
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe
#create data frame df = data. frame (team=rep(c(' A ', ' B '), each= 10 ), points=c(3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8, 7, 8, 9, 12, 12, 12, 14, 15, 17)) #view data frame df team points 1 to 3 2 to 3 3 to 4 4 to 5 5 to 4 6 to 7 7 to 7 8 to 7 9 to 10 10 to 11 11 B 8 12 B 7 13 B 8 14 B 9 15 B 12 16 B 12 17 B 12 18 B 14 19 B 15 20 B 17
Voorbeeld 1: Teken de verdeling van waarden met behulp van de dichtheidsplot
De volgende code laat zien hoe u de verdeling van waarden in de puntenkolom kunt plotten met behulp van een dichtheidsplot :
#plot distribution of values in points column
plot(density(df$points))
Deze syntaxis levert een vloeiende curve op die de verdeling van de waarden van een variabele samenvat.
Merk op dat we ook de titel, aslabels en lijnkleur in de dichtheidsplot kunnen wijzigen als we dat willen:
#plot distribution of values in points column plot(density(df$points), col=' red ', main=' Density Plot of Points ', xlab=' Points ')
Voorbeeld 2: Teken de verdeling van waarden met behulp van een histogram
De volgende code laat zien hoe u de verdeling van waarden in de kolom met punten kunt plotten met behulp van een histogram:
#plot distribution of values in points column using histogram
hist(df$points)
Een histogram gebruikt balken om de frequenties van waarden in de kolom met punten weer te geven, in tegenstelling tot een vloeiende lijn die de vorm van de verdeling samenvat.
Merk op dat we ook de titel, aslabels, kleur en aantal sprongen in het histogram kunnen wijzigen:
#plot distribution of values in points column using histogram hist(df$points, main=' Histogram of Points ', xlab=' Points ', col=' steelblue ', breaks= 12 )
Opmerking : hoe groter de waarde die u kiest voor het break- argument, hoe meer balken er in het histogram zullen zijn.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe u een verticale lijn aan het histogram toevoegt in R
Hoe kerneldichtheidsgrafieken te maken in R
Hoe dichtheidsgrafieken in ggplot2 over elkaar heen te leggen