Hoe de verdeling van kolomwaarden in r te plotten


U kunt de volgende methoden gebruiken om een verdeling van kolomwaarden in R te plotten:

Methode 1: Teken de verdeling van waarden met behulp van de dichtheidsplot

 plot(density(df$my_column))

Methode 2: Teken de verdeling van waarden met behulp van een histogram

 hist(df$my_column)

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe

 #create data frame
df = data. frame (team=rep(c(' A ', ' B '), each= 10 ),
                points=c(3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 8,
                         7, 8, 9, 12, 12, 12, 14, 15, 17))

#view data frame
df

   team points
1 to 3
2 to 3
3 to 4
4 to 5
5 to 4
6 to 7
7 to 7
8 to 7
9 to 10
10 to 11
11 B 8
12 B 7
13 B 8
14 B 9
15 B 12
16 B 12
17 B 12
18 B 14
19 B 15
20 B 17

Voorbeeld 1: Teken de verdeling van waarden met behulp van de dichtheidsplot

De volgende code laat zien hoe u de verdeling van waarden in de puntenkolom kunt plotten met behulp van een dichtheidsplot :

 #plot distribution of values in points column
plot(density(df$points)) 

Deze syntaxis levert een vloeiende curve op die de verdeling van de waarden van een variabele samenvat.

Merk op dat we ook de titel, aslabels en lijnkleur in de dichtheidsplot kunnen wijzigen als we dat willen:

 #plot distribution of values in points column
plot(density(df$points), col=' red ', main=' Density Plot of Points ', xlab=' Points ')

plot de verdeling van kolomwaarden in R met behulp van een dichtheidsplot

Voorbeeld 2: Teken de verdeling van waarden met behulp van een histogram

De volgende code laat zien hoe u de verdeling van waarden in de kolom met punten kunt plotten met behulp van een histogram:

 #plot distribution of values in points column using histogram
hist(df$points)

Een histogram gebruikt balken om de frequenties van waarden in de kolom met punten weer te geven, in tegenstelling tot een vloeiende lijn die de vorm van de verdeling samenvat.

Merk op dat we ook de titel, aslabels, kleur en aantal sprongen in het histogram kunnen wijzigen:

 #plot distribution of values in points column using histogram
hist(df$points, main=' Histogram of Points ', xlab=' Points ', col=' steelblue ', breaks= 12 )

plot de verdeling van kolomwaarden in R met behulp van histogram

Opmerking : hoe groter de waarde die u kiest voor het break- argument, hoe meer balken er in het histogram zullen zijn.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Hoe u een verticale lijn aan het histogram toevoegt in R
Hoe kerneldichtheidsgrafieken te maken in R
Hoe dichtheidsgrafieken in ggplot2 over elkaar heen te leggen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert