Par défaut, les notebooks Jupyter n’affichent que 20 colonnes d’un DataFrame pandas. Vous pouvez facilement forcer le notebook à afficher toutes les colonnes en utilisant la syntaxe suivante : pd.set_option('max_columns', None) Vous pouvez également utiliser la syntaxe suivante pour afficher tous les...
Vous pouvez utiliser l’une des trois méthodes suivantes pour ajouter une ligne d’en-tête à un DataFrame pandas : #add header row when creating DataFrame df = pd.DataFrame(data=[data_values], columns=['col1', 'col2', 'col3']) #add header row after creating DataFrame df = pd.DataFrame(data=[data_values]) df.columns = ['A',...
Vous pouvez utiliser la syntaxe suivante pour soustraire une colonne d’une autre dans un DataFrame pandas : #subtract column 'B' from column 'A' df['A-B'] = df.A- df.B Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique. Exemple 1 : soustraire deux...
Vous pouvez utiliser la syntaxe de base suivante pour diviser une colonne de chaîne dans un DataFrame pandas en plusieurs colonnes : #split column A into two columns: column A and column B df[['A', 'B']] = df['A'].str.split(',', 1, expand=True) Les exemples suivants...
Vous pouvez utiliser la fonction pct_change() pour calculer le pourcentage de changement entre les valeurs dans les pandas : #calculate percent change between values in pandas Series s.pct_change() #calculate percent change between rows in pandas DataFrame df['column_name'].pct_change() Les exemples suivants montrent comment...
Vous pouvez utiliser la syntaxe suivante pour exclure des colonnes dans un DataFrame pandas : #exclude column1 df.loc[:, df.columns!='column1'] #exclude column1, column2, ... df.loc[:, ~df.columns.isin(['column1', 'column2', ...])] Les exemples suivants montrent comment utiliser cette syntaxe dans la pratique. Exemple 1 : exclure une colonne...
Il existe deux types de tests du Chi carré couramment utilisés : Test d’ajustement du chi carré : utilisé pour déterminer si une variable catégorielle suit ou non une distribution hypothétique. Test d’indépendance du chi carré : utilisé pour déterminer s’il existe ou...
Vous pouvez utiliser les fonctions lines() et points() pour superposer plusieurs tracés dans R : #create scatterplot of x1 vs. y1 plot(x1, y1) #overlay line plot of x2 vs. y2 lines(x2, y2) #overlay scatterplot of x3 vs. y3 points(x2, y2) Les exemples...
Une ANOVA à mesures répétées est utilisée pour déterminer s’il existe ou non une différence statistiquement significative entre les moyennes de trois groupes ou plus dans lesquels les mêmes sujets apparaissent dans chaque groupe. Lorsque nous rapportons les résultats d’une ANOVA...