Hoe de colmeans()-functie in r te gebruiken
De functie colMeans() in R kan worden gebruikt om het gemiddelde van meerdere kolommen van een matrix of dataframe in R te berekenen.
Deze functie gebruikt de volgende basissyntaxis:
#calculate column means of every column colMeans(df) #calculate column means and exclude NA values colMeans(df, na. rm = T ) #calculate column means of specific columns colMeans(df[c(' col1 ', ' col3 ', ' col4 ')])
De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld 1: Bereken het gemiddelde van elke kolom
De volgende code laat zien hoe u het gemiddelde van elke kolom in een gegevensframe kunt berekenen:
#create data frame df <- data. frame (points=c(99, 91, 86, 88, 95), assists=c(33, 28, 31, 39, 34), rebounds=c(30, 28, 24, 24, 28), blocks=c(1, 4, 11, 0, 2)) #calculate column means colMeans(df) points assists rebounds blocks 91.8 33.0 26.8 3.6
Voorbeeld 2 : Bereken het gemiddelde van elke kolom en sluit NA’s uit
De volgende code laat zien hoe u het gemiddelde van elke kolom berekent en NA-waarden uitsluit:
#create data frame with some NA values df <- data. frame (points=c(99, 91, 86, 88, 95), assists=c(33, NA, 31, 39, 34), rebounds=c(30, 28, NA, NA, 28), blocks=c(1, 4, 11, 0, 2)) #calculate column means colMeans(df, na. rm = T ) points assists rebounds blocks 91.80000 34.25000 28.66667 3.60000
Voorbeeld 3: Bereken het gemiddelde van specifieke kolommen
De volgende code laat zien hoe u de gemiddelde waarden van specifieke kolommen in het dataframe kunt berekenen:
#create data frame df <- data. frame (points=c(99, 91, 86, 88, 95), assists=c(33, 28, 31, 39, 34), rebounds=c(30, 28, 24, 24, 28), blocks=c(1, 4, 11, 0, 2)) #calculate column means for 'points' and 'blocks' columns colMeans(df[c(' points ', ' blocks ')]) point blocks 91.8 3.6
Merk op dat we ook indexwaarden kunnen gebruiken om het gemiddelde van specifieke kolommen te bepalen:
#create data frame df <- data. frame (points=c(99, 91, 86, 88, 95), assists=c(33, 28, 31, 39, 34), rebounds=c(30, 28, 24, 24, 28), blocks=c(1, 4, 11, 0, 2)) #calculate column means for columns in position 1 and 4 colMeans(df[c(1, 4)]) point blocks 91.8 3.6
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende functies in R kunt uitvoeren:
Hoe de standaardafwijking van kolommen in R te berekenen
Hoe het gemiddelde per groep in R te berekenen
Hoe de som per groep in R te berekenen