Hoe u het gemiddelde van een kolom in r kunt berekenen (met voorbeelden)


U kunt een van de volgende methoden gebruiken om het gemiddelde van een kolom in R te berekenen:

 #calculate mean using column name
mean(df$my_column)

#calculate mean using column name (ignore missing values)
mean(df$my_column, na. rm = TRUE )

#calculate mean using column position
mean(df[, 1])

#calculation mean of all numeric columns
colMeans(df[sapply(df, is. numeric )])

De volgende voorbeelden laten zien hoe u elke methode kunt gebruiken met het volgende dataframe in R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 points=c(99, 90, 93, 86, 88, 82),
                 assists=c(33, 28, 31, 39, NA, 30))

#view data frame
df

  team points assists
1 A 99 33
2 A 90 28
3 A 93 31
4 B 86 39
5 B 88 NA
6 B 82 30

Voorbeeld 1: Bereken het gemiddelde met behulp van de kolomnaam

De volgende code laat zien hoe u het gemiddelde van de kolom ‚punten‘ kunt berekenen met behulp van de kolomnaam:

 #calculate mean of 'points' column
mean(df$points)

[1] 89.66667

De gemiddelde waarde in de kolom “punten” is 89,66667 .

Voorbeeld 2: Bereken het gemiddelde met behulp van de kolomnaam (negeer ontbrekende waarden)

Als we proberen het gemiddelde te berekenen van een kolom die ontbrekende waarden bevat, krijgen we NA :

 #attempt to calculate mean of 'assists' column
mean(df$assists)

[1] NA

We moeten na.rm=TRUE gebruiken om ontbrekende waarden te negeren bij het berekenen van het kolomgemiddelde:

 #calculate mean of 'assists' column and ignore missing values
mean(df$assists, na. rm = TRUE )

[1] 32.2

De gemiddelde waarde in de kolom ‘assisten’ is 32,2 .

Voorbeeld 3: Bereken het gemiddelde met behulp van de kolompositie

De volgende code laat zien hoe u het gemiddelde van de kolom op indexpositie 2 berekent:

 #calculate mean of column in index position 2
mean(df[, 2])

[1] 89.66667

De gemiddelde waarde van de kolom op indexpositie 2 (de kolom „punten“) is 89,66667 .

Voorbeeld 4: Bereken het gemiddelde van alle numerieke kolommen

De volgende code laat zien hoe u het gemiddelde van alle numerieke kolommen in het gegevensframe berekent:

 #calculate mean of all numeric columns
colMeans(df[sapply(df, is. numeric )], na. rm = TRUE )

  assist points 
89.66667 32.20000

De uitvoer geeft de gemiddelde waarde van elke numerieke kolom in het gegevensframe weer.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere gemiddelde waarden in R kunt berekenen:

Hoe een getrimd gemiddelde in R te berekenen
Hoe het geometrische gemiddelde in R te berekenen
Hoe een gewogen gemiddelde in R te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert