Le domaine des statistiques concerne la collecte, l’analyse, l’interprétation et la présentation des données. Dans le domaine de la comptabilité, les statistiques sont importantes pour les raisons suivantes : Raison 1 : Les comptables utilisent des statistiques descriptives pour résumer les...
Le rang centile d’une valeur nous indique le pourcentage de valeurs dans un ensemble de données dont le classement est égal ou inférieur à une valeur donnée. Vous pouvez utiliser les méthodes suivantes pour calculer le rang centile chez les pandas :...
Vous pouvez utiliser la syntaxe de base suivante pour tracer plusieurs DataFrames pandas dans des sous-tracés : import matplotlib.pyplot as plt #define subplot layout fig, axes = plt.subplots(nrows=2, ncols=2) #add DataFrames to subplots df1.plot(ax=axes[0,0]) df2.plot(ax=axes[0,1]) df3.plot(ax=axes[1,0]) df4.plot(ax=axes[1,1]) L’exemple suivant montre comment utiliser...
Vous pouvez utiliser la fonction décrire() pour générer des statistiques descriptives pour les variables dans un DataFrame pandas. Vous pouvez utiliser la syntaxe de base suivante pour utiliser la fonction décrire() avec la fonction groupby() dans les pandas : df.groupby('group_var')['values_var'].describe() L’exemple suivant...
Vous pouvez utiliser le module xarray pour créer rapidement un DataFrame pandas 3D. Ce tutoriel explique comment créer le DataFrame pandas 3D suivant à l’aide des fonctions du module xarray : product_A product_B product_C year quarter 2021 Q1 1.624345 0.319039 50 Q2...
Le moyen le plus simple de trouver la probabilité à partir d’un score z consiste simplement à rechercher la probabilité qui correspond au score z dans le tableau z . Ce didacticiel explique comment utiliser la table z pour trouver les...
La moyenne représente la valeur moyenne dans un ensemble de données. Il est calculé comme suit : Moyenne de l’échantillon = Σx i / n où: Σ : Un symbole qui signifie « somme » x i : La i ème observation dans un ensemble...
L’un des algorithmes de clustering les plus courants dans l’apprentissage automatique est connu sous le nom de clustering k-means . Le clustering K-means est une technique dans laquelle nous plaçons chaque observation d’un ensemble de données dans l’un des K clusters....
Vous pouvez utiliser les méthodes suivantes pour utiliser LIKE (similaire à SQL) dans une fonction pandas query() afin de rechercher des lignes contenant un modèle particulier : Méthode 1 : rechercher les lignes contenant un modèle df.query('my_column.str.contains("pattern1")') Méthode 2 : rechercher des lignes contenant...
Vous pouvez utiliser les méthodes suivantes pour tracer une distribution de valeurs de colonne dans un DataFrame pandas : Méthode 1 : tracer la distribution des valeurs dans une colonne df['my_column'].plot(kind='kde') Méthode 2 : tracer la distribution des valeurs dans une colonne, regroupées par...