Come aggiungere una colonna di conteggio a un frame di dati in r


È possibile utilizzare la seguente sintassi di base per aggiungere una colonna “count” a un frame di dati in R:

 df %>%
  group_by(var1) %>%
  mutate(var1_count = n())

Questa particolare sintassi aggiunge una colonna chiamata var1_count al frame di dati che contiene il numero di valori nella colonna chiamata var1 .

L’esempio seguente mostra come utilizzare questa sintassi nella pratica.

Esempio: aggiungi una colonna numerica in R

Supponiamo di avere il seguente frame di dati in R che contiene informazioni su vari giocatori di basket:

 #define data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'),
                 position=c('G', 'F', 'F', 'F', 'G', 'G', 'F', 'F'),
                 points=c(18, 22, 19, 14, 14, 11, 20, 28))

#view data frame
df

  team position points
1 AG 18
2 AF 22
3 FY 19
4 BF 14
5 BG 14
6 BG 11
7 BF 20
8 BF 28

Possiamo utilizzare il codice seguente per aggiungere una colonna chiamata team_count che contiene il conteggio di ciascuna squadra:

 library (dplyr)

#add column that shows total count of each team
df %>%
  group_by(team) %>%
  mutate(team_count = n())

# A tibble: 8 x 4
# Groups: team [2]
  team position points team_count
              
1 AG 18 3
2 AF 22 3
3 FY 19 3
4 BF 14 5
5 BG 14 5
6 BG 11 5
7 BF 20 5
8 BF 28 5

Ci sono 3 linee con un valore di squadra A e 5 linee con un valore di squadra B.

COSÌ:

  • Per ogni riga in cui team è uguale ad A, il valore nella colonna team_count è 3 .
  • Per ogni riga in cui team è uguale a B, il valore nella colonna team_count è 5 .

Puoi anche aggiungere una colonna “conto” che raggruppa diverse variabili.

Ad esempio, il codice seguente mostra come aggiungere una colonna “account” che raggruppa le variabili di team e posizione :

 library (dplyr)

#add column that shows total count of each team and position
df %>%
  group_by(team, position) %>%
  mutate(team_pos_count = n())

# A tibble: 8 x 4
# Groups: team, position [4]
  team position points team_pos_count
                  
1 AG 18 1
2 AF 22 2
3 FY 19 2
4 BF 14 3
5 BG 14 2
6 BG 11 2
7 BF 20 3
8 BF 28 3

Dal risultato possiamo vedere:

  • C’è 1 riga che contiene A nella colonna della squadra e G nella colonna della posizione .
  • Ci sono 2 righe che contengono A nella colonna della squadra e F nella colonna della posizione .
  • Ci sono 3 righe che contengono B nella colonna della squadra e F nella colonna della posizione .
  • Ci sono 2 righe che contengono B nella colonna della squadra e F nella colonna della posizione .

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni in R:

Come raggruppare e contare con la condizione in R
Come contare il numero di elementi nell’elenco in R
Come selezionare singole righe in un frame di dati in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *