Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Comment utiliser la distribution t en Python



La distribution t est une distribution de probabilité similaire à la distribution normale , sauf qu’elle a des « queues » plus lourdes que la distribution normale.

Autrement dit, plus de valeurs dans la distribution sont situées aux extrémités que dans le centre par rapport à la distribution normale :

Distribution normale vs distribution t

Ce tutoriel explique comment utiliser la distribution t en Python.

Comment générer à la distribution

Vous pouvez utiliser la fonction t.rvs(df, size) pour générer des valeurs aléatoires à partir d’une distribution avec des degrés de liberté et une taille d’échantillon spécifiques :

from scipy.stats import t

#generate random values from t distribution with df=6 and sample size=10
t.rvs(df=6, size=10)

array([-3.95799716, -0.01099963, -0.55953846, -1.53420055, -1.41775611,
       -0.45384974, -0.2767931 , -0.40177789, -0.3602592 ,  0.38262431])

Le résultat est un tableau de 10 valeurs qui se suivent selon une distribution avec 6 degrés de liberté.

Comment calculer les valeurs P à l’aide de la distribution t

Nous pouvons utiliser la fonction t.cdf(x, df, loc=0, scale=1) pour trouver la valeur p associée à une statistique de test t.

Exemple 1 : Trouver une valeur P unilatérale

Supposons que nous effectuions un test d’hypothèse unilatéral et que nous obtenions une statistique de test de -1,5 et des degrés de liberté = 10 .

Nous pouvons utiliser la syntaxe suivante pour calculer la valeur p qui correspond à cette statistique de test :

from scipy.stats import t

#calculate p-value
t.cdf(x=-1.5, df=10)

0.08225366322272008

La valeur p unilatérale qui correspond à la statistique de test de -1,5 avec 10 degrés de liberté est de 0,0822 .

Exemple 2 : Trouver une valeur P bilatérale

Supposons que nous effectuions un test d’hypothèse bilatéral et que nous obtenions une statistique de test de 2,14 et des degrés de liberté = 20 .

Nous pouvons utiliser la syntaxe suivante pour calculer la valeur p qui correspond à cette statistique de test :

from scipy.stats import t

#calculate p-value
(1 - t.cdf(x=2.14, df=20)) * 2

0.04486555082549959

La valeur p bilatérale qui correspond à la statistique de test de 2,14 avec 20 degrés de liberté est de 0,0448 .

Remarque : Vous pouvez vérifier ces réponses à l’aide du calculateur de distribution t inverse .

Comment tracer à la distribution

Vous pouvez utiliser la syntaxe suivante pour tracer une distribution avec des degrés de liberté spécifiques :

from scipy.stats import t
import matplotlib.pyplot as plt

#generate t distribution with sample size 10000
x = t.rvs(df=12, size=10000)

#create plot of t distribution
plt.hist(x, density=True, edgecolor='black', bins=20)

diagramme de distribution t en Python

Alternativement, vous pouvez créer une courbe de densité à l’aide du package de visualisation seaborn :

import seaborn as sns

#create density curve
sns.kdeplot(x)

tracer la courbe de distribution t en Python

Ressources additionnelles

Les didacticiels suivants offrent des informations supplémentaires sur la distribution t :

Distribution normale vs distribution t : quelle est la différence ?
Calculateur de distribution t inverse

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *