R : Comment utiliser la fonction apply() sur des colonnes spécifiques



Souvent, vous souhaiterez peut-être utiliser la fonction apply() pour appliquer une fonction à des colonnes spécifiques dans un bloc de données dans R.

Cependant, la fonction apply() force d’abord toutes les colonnes d’un bloc de données à avoir le même type d’objet avant d’appliquer une fonction, ce qui peut parfois avoir des conséquences inattendues.

Un meilleur choix est la fonction lapply() , qui utilise la syntaxe de base suivante :

df[c('col1', 'col2')] <- lapply(df[c('col1', 'col2')], my_function)

Cet exemple particulier applique la fonction my_function uniquement à col1 et col2 dans le bloc de données.

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : appliquer une fonction à des colonnes spécifiques du bloc de données

Supposons que nous ayons le bloc de données suivant dans R :

#create data frame
df <- data.frame(team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(19, 22, 15, NA, 14, 25, 25, 25),
                 rebounds=c(10, 6, 3, 7, 11, 13, 9, 12),
                 assists=c(4, 4, 3, 6, 7, 5, 10, 8))

#view data frame
df

  team points rebounds assists
1    A     19       10       4
2    A     22        6       4
3    A     15        3       3
4    A     NA        7       6
5    B     14       11       7
6    B     25       13       5
7    B     25        9      10
8    B     25       12       8

Supposons maintenant que nous définissions la fonction suivante qui multiplie les valeurs par 2 puis ajoute 1 :

#define function
my_function <- function(x) x*2 + 1

Nous pouvons utiliser la fonction lapply() suivante pour appliquer cette fonction uniquement aux colonnes de points et de rebonds dans le bloc de données :

#apply function to specific columns
df[c('points', 'rebounds')] <- lapply(df[c('points', 'rebounds')], my_function)

#view updated data frame
df

  team points rebounds assists
1    A     39       21       4
2    A     45       13       4
3    A     31        7       3
4    A     NA       15       6
5    B     29       23       7
6    B     51       27       5
7    B     51       19      10
8    B     51       25       8

À partir du résultat, nous pouvons voir que nous avons multiplié chaque valeur dans les colonnes de points et de rebonds par 2, puis ajouté 1.

Notez également que les colonnes des équipes et des passes décisives sont restées inchangées.

Ressources additionnelles

Les didacticiels suivants expliquent comment effectuer d’autres tâches courantes dans R :

Un guide pour apply(), lapply(), sapply() et tapply() dans R
Comment utiliser la fonction de transformation dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *