Comment lire le tableau de distribution F
Ce tutoriel explique comment lire et interpréter la table de distribution F.
Qu’est-ce que la table de distribution F ?
Le tableau de distribution F est un tableau qui montre les valeurs critiques de la distribution F. Pour utiliser la table de distribution F, vous n’avez besoin que de trois valeurs :
- Les degrés de liberté du numérateur
- Les degrés de liberté du dénominateur
- Le niveau alpha (les choix courants sont 0,01, 0,05 et 0,10)
Le tableau suivant montre le tableau de distribution F pour alpha = 0,10. Les nombres en haut du tableau représentent les degrés de liberté du numérateur (étiquetés DF1 dans le tableau) et les nombres sur le côté gauche du tableau représentent les degrés de liberté du dénominateur (étiquetés DF2 dans le tableau).
N’hésitez pas à cliquer sur le tableau pour zoomer.
Les valeurs critiques du tableau sont souvent comparées à la statistique F d’un test F. Si la statistique F est supérieure à la valeur critique trouvée dans le tableau, vous pouvez alors rejeter l’hypothèse nulle du test F et conclure que les résultats du test sont statistiquement significatifs.
Exemples d’utilisation de la table de distribution F
Le tableau de distribution F est utilisé pour trouver la valeur critique pour un test F. Les trois scénarios les plus courants dans lesquels vous effectuerez un test F sont les suivants :
- Test F dans l’analyse de régression pour tester la signification globale d’un modèle de régression.
- Test F en ANOVA (analyse de variance) pour tester une différence globale entre les moyennes des groupes.
- Test F pour savoir si deux populations ont des variances égales.
Voyons un exemple d’utilisation de la table de distribution F dans chacun de ces scénarios.
Test F dans l’analyse de régression
Supposons que nous effectuions une analyse de régression linéaire multiple en utilisant les heures étudiées et les examens préparatoires passés comme variables prédictives et la note à l’examen final comme variable de réponse. Lorsque nous exécutons l’analyse de régression, nous recevons le résultat suivant :
Source | SS | df | MS | F | P. |
---|---|---|---|---|---|
Régression | 546.53 | 2 | 273.26 | 5.09 | 0,033 |
Résiduel | 483.13 | 9 | 53,68 | ||
Total | 1029.66 | 11 |
Dans l’analyse de régression, la statistique f est calculée comme MS de régression / MS résiduelle. Cette statistique indique si le modèle de régression fournit un meilleur ajustement aux données qu’un modèle qui ne contient aucune variable indépendante. Essentiellement, il teste si le modèle de régression dans son ensemble est utile.
Dans cet exemple, la statistique F est 273,26 / 53,68 = 5,09 .
Supposons que nous voulions savoir si cette statistique F est significative au niveau alpha = 0,05. En utilisant le tableau de distribution F pour alpha = 0,05, avec le numérateur des degrés de liberté 2 ( df pour Régression) et le dénominateur degrés de liberté 9 ( df pour Résiduel) , nous constatons que la valeur critique F est 4,2565 .
Puisque notre statistique f ( 5,09 ) est supérieure à la valeur critique F ( 4,2565) , nous pouvons conclure que le modèle de régression dans son ensemble est statistiquement significatif.
Test F en ANOVA
Supposons que nous voulions savoir si trois techniques d’étude différentes conduisent ou non à des résultats d’examen différents. Pour tester cela, nous recrutons 60 étudiants. Nous assignons au hasard 20 étudiants chacun à utiliser l’une des trois techniques d’étude pendant un mois en préparation à un examen. Une fois que tous les étudiants ont passé l’examen, nous effectuons ensuite une ANOVA unidirectionnelle pour déterminer si la technique d’étude a ou non un impact sur les résultats de l’examen. Le tableau suivant montre les résultats de l’ANOVA unidirectionnelle :
Source | SS | df | MS | F | P. |
---|---|---|---|---|---|
Traitement | 58,8 | 2 | 29.4 | 1,74 | 0,217 |
Erreur | 202,8 | 12 | 16.9 | ||
Total | 261,6 | 14 |
Dans une ANOVA, la statistique f est calculée comme MS de traitement / MS d’erreur. Cette statistique indique si le score moyen des trois groupes est égal ou non.
Dans cet exemple, la statistique F est 29,4 / 16,9 = 1,74 .
Supposons que nous voulions savoir si cette statistique F est significative au niveau alpha = 0,05. En utilisant le tableau de distribution F pour alpha = 0,05, avec le numérateur des degrés de liberté 2 ( df pour Traitement) et le dénominateur degrés de liberté 12 ( df pour Erreur) , nous constatons que la valeur critique F est 3,8853 .
Puisque notre statistique f ( 1,74 ) n’est pas supérieure à la valeur critique F ( 3,8853) , nous concluons qu’il n’y a pas de différence statistiquement significative entre les scores moyens des trois groupes.
Test F pour les variances égales de deux populations
Supposons que nous voulions savoir si les variances de deux populations sont égales ou non. Pour tester cela, nous pouvons effectuer un test F pour variances égales dans lequel nous prenons un échantillon aléatoire de 25 observations de chaque population et trouvons la variance d’échantillon pour chaque échantillon.
La statistique de test pour ce F-Test est définie comme suit :
Statistique F = s 1 2 / s 2 2
où s 1 2 et s 2 2 sont les variances de l’échantillon. Plus ce rapport est éloigné de un, plus les preuves de variances inégales au sein de la population sont fortes.
La valeur critique du test F est définie comme suit :
Valeur critique F = valeur trouvée dans le tableau de distribution F avec n 1 -1 et n 2 -1 degrés de liberté et un niveau de signification de α.
Supposons que la variance de l’échantillon pour l’échantillon 1 soit de 30,5 et que la variance de l’échantillon pour l’échantillon 2 soit de 20,5. Cela signifie que notre statistique de test est 30,5 / 20,5 = 1,487 . Pour savoir si cette statistique de test est significative à alpha = 0,10, nous pouvons trouver la valeur critique dans le tableau de distribution F associé à alpha = 0,10, numérateur df = 24 et dénominateur df = 24. Ce nombre s’avère être 1,7019. .
Puisque notre statistique f ( 1,487 ) n’est pas supérieure à la valeur critique F ( 1,7019) , nous concluons qu’il n’y a pas de différence statistiquement significative entre les variances de ces deux populations.
Ressources additionnelles
Pour un ensemble complet de tableaux de distribution F pour les valeurs alpha 0,001, 0,01, 0,025, 0,05 et 0,10, consultez cette page .