Vous pouvez utiliser l’une des méthodes suivantes pour décaler les éléments d’un tableau NumPy : Méthode 1 : décaler les éléments (conserver tous les éléments d’origine) #shift each element two positions to the right data_new = np.roll(data, 2) Méthode 2 : décaler les éléments (autoriser le...
Vous pouvez utiliser la fonction cut() dans R pour créer une variable catégorielle à partir d’une variable continue. Cette fonction utilise la syntaxe de base suivante : df$cat_variable <- cut(df$continuous_variable, breaks=c(5, 10, 15, 20, 25), labels=c('A', 'B', 'C', 'D')) Notez que breaks...
La fonction gsub() dans R peut être utilisée pour remplacer toutes les occurrences d’un certain modèle dans une chaîne dans R. Pour remplacer plusieurs modèles à la fois, vous pouvez utiliser une instruction gsub() imbriquée : df$col1 <- gsub('old1', 'new1', gsub('old2', 'new2',...
Vous pouvez utiliser les méthodes suivantes pour supprimer les lignes en double sur plusieurs colonnes dans un DataFrame pandas : Méthode 1 : supprimer les doublons dans toutes les colonnes df.drop_duplicates() Méthode 2 : supprimer les doublons dans des colonnes spécifiques df.drop_duplicates(['column1', 'column3']) Les exemples suivants...
Vous pouvez utiliser la fonction suivante pour calculer un timedelta en mois entre deux colonnes d’un DataFrame pandas : def month_diff(x, y): end = x.dt.to_period('M').view(dtype='int64') start = y.dt.to_period('M').view(dtype='int64') return end-start L’exemple suivant montre comment utiliser cette fonction dans la pratique. Exemple : Calculer...
La fonction pandas factorize() peut être utilisée pour coder des chaînes sous forme de valeurs numériques. Vous pouvez utiliser les méthodes suivantes pour appliquer la fonction factorize() aux colonnes d’un DataFrame pandas : Méthode 1 : Factoriser une colonne df['col1'] = pd.factorize(df['col'])[0]...
Vous pouvez utiliser la syntaxe de base suivante dans Seaborn pour créer un boxplot de plusieurs colonnes d’un DataFrame pandas : sns.boxplot(x='variable', y='value', data=df) L’exemple suivant montre comment utiliser cette syntaxe dans la pratique. Exemple : Boxplot de plusieurs colonnes utilisant Seaborn Supposons...
Vous pouvez utiliser la syntaxe de base suivante pour calculer une moyenne mobile par groupe chez les pandas : #calculate 3-period moving average of 'values' by 'group' df.groupby('group')['values'].transform(lambda x: x.rolling(3, 1).mean()) L’exemple suivant montre comment utiliser cette syntaxe dans la pratique. Exemple :...
Vous pouvez utiliser la fonction pandas éclater() pour transformer chaque élément d’une liste en ligne dans un DataFrame. Cette fonction utilise la syntaxe de base suivante : df.explode('variable_to_explode') L’exemple suivant montre comment utiliser cette syntaxe dans la pratique. Exemple : utilisez la fonction...
Un test t pour échantillons appariés est utilisé pour comparer les moyennes de deux échantillons lorsque chaque observation dans un échantillon peut être associée à une observation dans l’autre échantillon. Ce type de test fait les hypothèses suivantes sur les données :...