Dr. Benjamin Anderson, Author at Statorials

L’importance des statistiques en comptabilité (avec exemples)

Par Dr. Benjamin Anderson juillet 16, 2023 Guide 0 commentaire

Le domaine des statistiques concerne la collecte, l’analyse, l’interprétation et la présentation des données. Dans le domaine de la comptabilité, les statistiques sont importantes pour les raisons suivantes : Raison 1 : Les comptables utilisent des statistiques descriptives pour résumer les...

[Continuer la lecture...]

Comment calculer le rang centile chez les pandas (avec exemples)

Par Dr. Benjamin Anderson juillet 16, 2023 Guide 0 commentaire

Le rang centile d’une valeur nous indique le pourcentage de valeurs dans un ensemble de données dont le classement est égal ou inférieur à une valeur donnée. Vous pouvez utiliser les méthodes suivantes pour calculer le rang centile chez les pandas :...

[Continuer la lecture...]

Pandas : Comment tracer plusieurs DataFrames dans des sous-parcelles

Par Dr. Benjamin Anderson juillet 16, 2023 Guide 0 commentaire

Vous pouvez utiliser la syntaxe de base suivante pour tracer plusieurs DataFrames pandas dans des sous-tracés : import matplotlib.pyplot as plt #define subplot layout fig, axes = plt.subplots(nrows=2, ncols=2) #add DataFrames to subplots df1.plot(ax=axes[0,0]) df2.plot(ax=axes[0,1]) df3.plot(ax=axes[1,0]) df4.plot(ax=axes[1,1]) L’exemple suivant montre comment utiliser...

[Continuer la lecture...]

Pandas : comment utiliser décrire() par groupe

Par Dr. Benjamin Anderson juillet 16, 2023 Guide 0 commentaire

Vous pouvez utiliser la fonction décrire() pour générer des statistiques descriptives pour les variables dans un DataFrame pandas. Vous pouvez utiliser la syntaxe de base suivante pour utiliser la fonction décrire() avec la fonction groupby() dans les pandas : df.groupby('group_var')['values_var'].describe() L’exemple suivant...

[Continuer la lecture...]

Comment créer un DataFrame Pandas 3D (avec exemple)

Par Dr. Benjamin Anderson juillet 16, 2023 Guide 0 commentaire

Vous pouvez utiliser le module xarray pour créer rapidement un DataFrame pandas 3D. Ce tutoriel explique comment créer le DataFrame pandas 3D suivant à l’aide des fonctions du module xarray : product_A product_B product_C year quarter 2021 Q1 1.624345 0.319039 50 Q2...

[Continuer la lecture...]

Comment trouver la probabilité à partir d’un score Z : avec des exemples

Par Dr. Benjamin Anderson juillet 16, 2023 Guide 0 commentaire

Le moyen le plus simple de trouver la probabilité à partir d’un score z consiste simplement à rechercher la probabilité qui correspond au score z dans le tableau z . Ce didacticiel explique comment utiliser la table z pour trouver les...

[Continuer la lecture...]

La relation entre la moyenne & Écart type (avec exemple)

Par Dr. Benjamin Anderson juillet 16, 2023 Guide 0 commentaire

La moyenne représente la valeur moyenne dans un ensemble de données. Il est calculé comme suit : Moyenne de l’échantillon = Σx i / n où: Σ : Un symbole qui signifie « somme » x i : La i ème observation dans un ensemble...

[Continuer la lecture...]

Clustering K-Means en Python : exemple étape par étape

Par Dr. Benjamin Anderson juillet 16, 2023 Guide 0 commentaire

L’un des algorithmes de clustering les plus courants dans l’apprentissage automatique est connu sous le nom de clustering k-means . Le clustering K-means est une technique dans laquelle nous plaçons chaque observation d’un ensemble de données dans l’un des K clusters....

[Continuer la lecture...]

Pandas : comment utiliser LIKE dans la requête ()

Par Dr. Benjamin Anderson juillet 16, 2023 Guide 0 commentaire

Vous pouvez utiliser les méthodes suivantes pour utiliser LIKE (similaire à SQL) dans une fonction pandas query() afin de rechercher des lignes contenant un modèle particulier : Méthode 1 : rechercher les lignes contenant un modèle df.query('my_column.str.contains("pattern1")') Méthode 2 : rechercher des lignes contenant...

[Continuer la lecture...]

Comment tracer la distribution des valeurs de colonne dans Pandas

Par Dr. Benjamin Anderson juillet 16, 2023 Guide 0 commentaire

Vous pouvez utiliser les méthodes suivantes pour tracer une distribution de valeurs de colonne dans un DataFrame pandas : Méthode 1 : tracer la distribution des valeurs dans une colonne df['my_column'].plot(kind='kde') Méthode 2 : tracer la distribution des valeurs dans une colonne, regroupées par...

[Continuer la lecture...]

Auteur/autrice : Dr. Benjamin Anderson