R : Créer un nouveau bloc de données à partir d’un bloc de données existant



Il existe deux manières courantes de créer un nouveau bloc de données à partir d’un bloc de données existant dans R :

Méthode 1 : sélectionner les noms de colonnes dans le bloc de données existant

new_df <- df[c('var1', 'var3', 'var4')]

Méthode 2 : sélectionner et renommer les noms de colonnes à partir du bloc de données existant

new_df <- data.frame('new_var1' = df$var1, 
                     'new_var2' = df$var2, 
                     'new_var3' = df$var3)

Les exemples suivants montrent comment utiliser chaque méthode avec le bloc de données suivant dans R :

#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 points=c(19, 14, 14, 29, 25, 30),
                 assists=c(4, 5, 5, 4, 12, 10),
                 rebounds=c(9, 7, 7, 6, 10, 11))

#view data frame
df

  team points assists rebounds
1    A     19       4        9
2    A     14       5        7
3    A     14       5        7
4    B     29       4        6
5    B     25      12       10
6    B     30      10       11

Exemple 1 : sélectionner les noms de colonnes dans le bloc de données existant

Le code suivant montre comment créer un nouveau bloc de données en sélectionnant plusieurs noms de colonnes dans un bloc de données existant :

#define new data frame
new_df <- df[c('team', 'assists', 'points')]

#view new data frame
new_df

  team assists points
1    A       4     19
2    A       5     14
3    A       5     14
4    B       4     29
5    B      12     25
6    B      10     30

Le nouveau bloc de données contient trois colonnes (équipe, passes décisives, points) du bloc de données existant.

Exemple 2 : Sélectionner et renommer les noms de colonnes à partir du bloc de données existant

Le code suivant montre comment créer un nouveau bloc de données en sélectionnant et en renommant plusieurs colonnes d’un bloc de données existant :

#define new data frame
new_df <- data.frame('team_name' = df$team, 
                     'total_assists' = df$assists, 
                     'total_points' = df$points)

#view new data frame
new_df

  team_name total_assists total_points
1         A             4           19
2         A             5           14
3         A             5           14
4         B             4           29
5         B            12           25
6         B            10           30

Le nouveau bloc de données contient trois colonnes (équipe, passes décisives, points) du bloc de données existant, mais nous avons spécifié de nouveaux noms pour chacune des colonnes du nouveau bloc de données.

Cette approche est particulièrement utile si vous savez à l’avance que vous souhaitez renommer les colonnes du nouveau bloc de données.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Comment ajouter des lignes à un bloc de données dans R
Comment conserver certaines colonnes dans R
Comment sélectionner uniquement les colonnes numériques dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *