Comment sélectionner les N premières lignes d’un bloc de données dans R (3 exemples)



Vous pouvez utiliser l’une des méthodes suivantes pour sélectionner les N premières lignes d’un bloc de données dans R :

Méthode 1 : utiliser head() depuis Base R

head(df, 3)

Méthode 2 : utiliser l’indexation à partir de Base R

df[1:3, ]

Méthode 3 : utilisez slice() depuis dplyr

library(dplyr)

df %>% slice(1:3)

Les exemples suivants montrent comment utiliser chaque méthode en pratique avec le bloc de données suivant :

#create data frame
df <- data.frame(team=c('A', 'B', 'C', 'D', 'E', 'F', 'G'),
                 points=c(99, 90, 86, 88, 95, 99, 91),
                 assists=c(33, 28, 31, 39, 34, 35, 40))

#view data frame
df

  team points assists
1    A     99      33
2    B     90      28
3    C     86      31
4    D     88      39
5    E     95      34
6    F     99      35
7    G     91      40

Exemple 1 : utiliser head() depuis Base R

Une façon de sélectionner les N premières lignes d’un bloc de données consiste à utiliser la fonction head() de la base R :

#select first 3 rows of data frame
head(df, 3)

  team points assists
1    A     99      33
2    B     90      28
3    C     86      31

Si vous utilisez la fonction head() sans aucun argument numérique, R sélectionnera automatiquement les 6 premières lignes du bloc de données :

#select first 6 rows of data frame
head(df)

  team points assists
1    A     99      33
2    B     90      28
3    C     86      31
4    D     88      39
5    E     95      34
6    F     99      35

Exemple 2 : Utiliser l’indexation à partir de Base R

Une autre façon de sélectionner les N premières lignes d’un bloc de données consiste à utiliser la syntaxe d’indexation à partir de la base R :

#select first 3 rows of data frame
df[1:3, ]

  team points assists
1    A     99      33
2    B     90      28
3    C     86      31

Vous pouvez également utiliser cette syntaxe pour sélectionner uniquement les N premières lignes d’une colonne spécifique :

#select first 3 rows of 'team' and 'points' columns only
df[1:3, c('team', 'points')]

  team points
1    A     99
2    B     90
3    C     86

Exemple 3 : utilisez slice() depuis dplyr

Une autre façon de sélectionner les N premières lignes d’un bloc de données consiste à utiliser la fonction slice() du package dplyr :

library(dplyr)

#select first 3 rows of data frame
df %>% slice(1:3)

  team points assists
1    A     99      33
2    B     90      28
3    C     86      31

Connexe : Comment utiliser la fonction slice() dans dplyr (avec exemples)

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment ajouter des lignes à un bloc de données dans R
Comment supprimer les lignes en double dans R
Comment additionner des lignes spécifiques dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *