Hoe de colmeans()-functie in r te gebruiken


De functie colMeans() in R kan worden gebruikt om het gemiddelde van meerdere kolommen van een matrix of dataframe in R te berekenen.

Deze functie gebruikt de volgende basissyntaxis:

 #calculate column means of every column
colMeans(df)

#calculate column means and exclude NA values
colMeans(df, na. rm = T )

#calculate column means of specific columns
colMeans(df[c(' col1 ', ' col3 ', ' col4 ')])

De volgende voorbeelden laten zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld 1: Bereken het gemiddelde van elke kolom

De volgende code laat zien hoe u het gemiddelde van elke kolom in een gegevensframe kunt berekenen:

 #create data frame
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means
colMeans(df)

  points assists rebounds blocks 
    91.8 33.0 26.8 3.6

Voorbeeld 2 : Bereken het gemiddelde van elke kolom en sluit NA’s uit

De volgende code laat zien hoe u het gemiddelde van elke kolom berekent en NA-waarden uitsluit:

 #create data frame with some NA values
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, NA, 31, 39, 34),
                 rebounds=c(30, 28, NA, NA, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means
colMeans(df, na. rm = T )

  points assists rebounds blocks 
91.80000 34.25000 28.66667 3.60000

Voorbeeld 3: Bereken het gemiddelde van specifieke kolommen

De volgende code laat zien hoe u de gemiddelde waarden van specifieke kolommen in het dataframe kunt berekenen:

 #create data frame
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means for 'points' and 'blocks' columns
colMeans(df[c(' points ', ' blocks ')])

point blocks 
  91.8 3.6

Merk op dat we ook indexwaarden kunnen gebruiken om het gemiddelde van specifieke kolommen te bepalen:

 #create data frame
df <- data. frame (points=c(99, 91, 86, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, 28),
                 blocks=c(1, 4, 11, 0, 2))

#calculate column means for columns in position 1 and 4
colMeans(df[c(1, 4)])

point blocks 
  91.8 3.6

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende functies in R kunt uitvoeren:

Hoe de standaardafwijking van kolommen in R te berekenen
Hoe het gemiddelde per groep in R te berekenen
Hoe de som per groep in R te berekenen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert