Souvent, dans les statistiques, nous souhaitons collecter des données afin de pouvoir répondre à certaines questions de recherche. Par exemple, nous pourrions vouloir répondre aux questions suivantes : 1. Quel est le revenu médian des ménages à Cincinnati, Ohio ? 2. Quel est...
La régression linéaire est une méthode que nous pouvons utiliser pour comprendre la relation entre une ou plusieurs variables prédictives et une variable de réponse . Généralement, lorsque nous effectuons une régression linéaire, nous souhaitons estimer la valeur moyenne de la...
La régression linéaire est une méthode que nous pouvons utiliser pour comprendre la relation entre une ou plusieurs variables prédictives et une variable de réponse . Généralement, lorsque nous effectuons une régression linéaire, nous souhaitons estimer la valeur moyenne de la...
Une moyenne mobile est simplement la moyenne d’un certain nombre de périodes précédentes dans une série chronologique. Pour calculer la moyenne glissante d’une ou plusieurs colonnes dans un DataFrame pandas, nous pouvons utiliser la syntaxe suivante : df['column_name'].rolling(rolling_window).mean() Ce tutoriel fournit plusieurs...
Vous pouvez afficher plusieurs lignes dans un seul tracé Matplotlib en utilisant la syntaxe suivante : import matplotlib.pyplot as plt plt.plot(df['column1']) plt.plot(df['column2']) plt.plot(df['column3']) ... plt.show() Ce didacticiel fournit plusieurs exemples de la façon de tracer plusieurs lignes dans un graphique à l’aide...
Deux événements s’excluent mutuellement s’ils ne peuvent pas se produire en même temps. Par exemple, supposons que l’événement A soit l’événement selon lequel un dé tombe sur un nombre pair et que l’événement B soit l’événement selon lequel un dé tombe...
Une variable dichotomique est un type de variable qui ne prend que deux valeurs possibles. Voici quelques exemples de variables dichotomiques : Sexe : Homme ou Femme Coin Flip : Pile ou Face Type de propriété : Résidentielle ou Commerciale Statut d’athlète : Professionnel ou Amateur...
Il existe deux façons de créer un nuage de points à l’aide des données d’un DataFrame pandas : 1. Utilisez pandas.DataFrame.plot.scatter Une façon de créer un nuage de points consiste à utiliser la fonction pandas plot.scatter() intégrée : import pandas as pd df.plot.scatter(x...
Une expérience est une étude scientifique contrôlée. En statistiques, nous menons souvent des expériences pour comprendre comment la modification d’une variable affecte une autre variable. Une variable manipulée est une variable que nous modifions ou « manipulons » pour voir comment...
L’une des hypothèses clés de la régression linéaire est que les résidus sont distribués avec une variance égale à chaque niveau de la variable prédictive. Cette hypothèse est connue sous le nom d’homoscédasticité . Lorsque cette hypothèse n’est pas respectée, on...