Quartiles

Dans cet article, nous expliquons ce que sont les quartiles. Vous trouverez la définition de chaque quartile, comment les calculer et plusieurs exemples concrets. Nous vous montrons également comment calculer des quartiles pour les données regroupées. De plus, vous pourrez calculer les quartiles de n’importe quel ensemble de données avec une calculatrice en ligne.

Que sont les quartiles ?

En statistiques, les quartiles sont les trois valeurs qui divisent un ensemble de données ordonnées en quatre parties égales. Ainsi, les premier, deuxième et troisième quartiles représentent respectivement 25 %, 50 % et 75 % de l’ensemble des données statistiques.

Les quartiles sont représentés par un Q majuscule et l’indice du quartile, de sorte que le premier quartile est Q 1 , le deuxième quartile est Q 2 et le troisième quartile est Q 3 .

quartiles

👉 Vous pouvez utiliser la calculatrice ci-dessous pour calculer les quartiles de n’importe quel ensemble de données.

Il convient de noter que les quartiles sont une mesure de la position non centrale au même titre que les quintiles, les déciles et les percentiles. Vous pouvez vérifier en quoi consiste chacun de ces types de quantiles sur cette page Web.

premier quartile

Le premier quartile , également appelé quartile 1, est la valeur supérieure à 25 % des données statistiques d’un échantillon. Autrement dit, le premier quartile représente plus de 25 % des données observées.

Le premier quartile est exprimé par le symbole Q 1 et est utilisé pour désigner les plus petites valeurs de données de l’échantillon.

deuxième quartile

Le deuxième quartile , également appelé quartile 2, est la valeur supérieure à 50 % des données statistiques d’un échantillon. Par conséquent, le deuxième quartile sépare l’ensemble de données en deux moitiés et coïncide avec la médiane et le cinquième décile.

Le symbole du deuxième quartile est Q 2 .

troisième quartile

Le troisième quartile , également appelé 3ème quartile, est la valeur qui dépasse 75 % des données statistiques d’un échantillon. Autrement dit, le troisième quartile représente plus de 75 % des données collectées.

Le troisième quartile est exprimé par le symbole Q 3 et représente les plus grandes valeurs de l’échantillon.

Comment calculer les quartiles

Pour calculer la position des quartiles d’un ensemble de données statistiques, vous devez multiplier le nombre de quartiles par la somme du nombre total de données plus un et diviser le résultat par quatre.

La formule des quartiles est donc la suivante :

\cfrac{k\cdot (n+1)}{4} \qquad k=1, 2, 3

Attention : cette formule nous indique la position du quartile, pas la valeur du quartile. Le quartile sera la donnée située à la position obtenue par la formule.

Cependant, parfois le résultat de cette formule nous donnera un nombre décimal. Il faut donc distinguer deux cas selon que le résultat est un nombre décimal ou non :

  • Si le résultat de la formule est un nombre sans partie décimale , le quartile est la donnée qui se trouve dans la position fournie par la formule ci-dessus.
  • Si le résultat de la formule est un nombre avec une partie décimale , la valeur du quartile est calculée à l’aide de la formule suivante :

Q=x_i+d\cdot (x_{i+1}-x_i)

x i et x i+1 sont les nombres des positions entre lesquelles se trouve le nombre obtenu par la première formule, et d est la partie décimale du nombre obtenu par la première formule.

Maintenant, peut-être que le calcul des quartiles est pour vous très compliqué, car beaucoup de choses doivent être prises en compte. Mais avec les deux exemples de la section suivante, vous verrez à quel point cela est en réalité assez simple.

Remarque : Dans la communauté scientifique, il n’y a pas de consensus sur le calcul des quartiles, vous trouverez donc peut-être un livre de statistiques qui l’explique un peu différemment.

Exemples de calcul de quartiles

Pour bien comprendre comment sont calculés les quartiles, vous trouverez ci-dessous deux exercices résolus. Dans le premier les quartiles sont des nombres entiers et dans le second les quartiles sont des nombres décimaux, vous pourrez ainsi voir les deux cas que vous pouvez trouver.

Exemple 1

  • Calculez les trois quartiles de l’ensemble de données suivant :
exercice de données triées

Comme nous l’avons vu plus haut, la formule pour déterminer les quartiles est :

\cfrac{k\cdot (n+1)}{4} \qquad k=1, 2, 3

Dans ce cas n , le nombre total d’observations, est de 15, il faut donc remplacer n par 15 et k par 1 pour trouver le premier quartile :

\cfrac{1\cdot (15+1)}{4}=4 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad Q_1=39

Par conséquent, le premier quartile est le nombre en position quatre de la liste ordonnée de valeurs, qui dans ce cas est 39.

De la même manière, on calcule le deuxième quartile en remplaçant le coefficient k par un 2 :

\cfrac{2\cdot (15+1)}{4}=8 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad Q_2=48

Le quartile 2 est donc le huitième nombre de la liste triée, ce qui correspond à la valeur 48.

Enfin, on applique une dernière fois la formule avec k =3 pour calculer le troisième quartile :

\cfrac{3\cdot (15+1)}{4}=12 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad Q_3=60

Le quartile 3 correspond aux données qui se trouvent en douzième position, soit 60.

Exemple 2

  • Trouvez les trois quartiles de la série de données suivante :
exercice résolu, données triées

Dans ce deuxième exemple, nous avons 24 observations, donc les nombres obtenus à partir de la formule quartile seront décimaux.

Nous calculons d’abord la position du premier quartile en substituant k à 1 dans la formule générale :

\cfrac{k\cdot (n+1)}{4}

\cfrac{1\cdot (24+1)}{4}=6,25

Mais nous avons obtenu le nombre décimal 6,25, de sorte que le premier quartile se situe entre la sixième et la septième donnée, qui sont respectivement 22 et 25. Par conséquent, pour calculer le quartile exact, nous devons appliquer la formule suivante :

Q=x_i+d\cdot (x_{i+1}-x_i)

Dans ce cas x i vaut 22, x i+1 25 et d est la partie décimale du nombre obtenu, soit 0,25. Pourtant:

Q_1=22+0,25\cdot (25-22)=22,75

Maintenant, nous faisons la même procédure pour trouver le deuxième quartile :

\cfrac{2\cdot (24+1)}{4}=12,5

Encore une fois, nous obtenons un nombre décimal de la formule, dans ce cas il s’agit de 12,5. Il faut donc utiliser la même formule avec les douzième et treizième nombres du tableau de données, qui correspondent à 49 et 50 :

Q_2=49+0,5\cdot (50-49)=49,5

Enfin, on répète le même processus pour obtenir le troisième quartile :

\cfrac{3\cdot (24+1)}{4}=18,75

Mais le nombre 18,75 est entre le nombre 18 et 19, donc le troisième quartile sera entre les valeurs de ces positions (71 et 73). Plus précisément, ce sera la valeur que l’on obtiendra de l’expression suivante :

Q_3=71+0,75\cdot (73-71)=72,5

calculateur de quartiles

Branchez un ensemble de données statistiques dans la calculatrice ci-dessous pour calculer les quartiles. Les données doivent être séparées par un espace et saisies en utilisant le point comme séparateur décimal.

Quartiles dans les données groupées

Pour calculer des quartiles lorsque les données sont regroupées en intervalles, nous devons d’abord trouver l’intervalle ou la classe dans lequel se trouve le quartile à l’aide de la formule suivante :

\cfrac{k\cdot (n+1)}{4} \qquad k=1, 2, 3

Le quartile sera donc dans l’intervalle dont la fréquence cumulée absolue est immédiatement supérieure au nombre obtenu avec l’expression précédente.

Et une fois que l’on connaît l’intervalle auquel appartient le quartile, il faut appliquer la formule suivante pour trouver la valeur exacte du quartile :

Q_k=L_i+ \cfrac{\displaystyle\frac{k\cdot (n+1)}{4}-F_{i-1}}{f_i}\cdot I_i \qquad k=1,2,3

Où:

  • L i est la limite inférieure de l’intervalle dans lequel se situe le quartile.
  • n est le nombre total d’observations.
  • F i-1 est la fréquence absolue cumulée de l’intervalle précédent.
  • f i est la fréquence absolue de l’intervalle dans lequel se situe le quartile.
  • I i est la largeur de l’intervalle quartile.

A titre d’exemple, voici un exercice pour calculer des quartiles dans une série de données groupées :

données regroupées par quartile

Pour calculer le premier quartile, il faut d’abord déterminer l’intervalle dans lequel il se situe. Pour ce faire, nous appliquons la formule suivante :

\cfrac{k\cdot (n+1)}{4}

\cfrac{1\cdot (30+1)}{4} =7,75 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [50,60)

Donc le premier quartile sera dans l’intervalle dont la fréquence absolue cumulée est immédiatement supérieure à 7,75, dans ce cas c’est l’intervalle [50,60) dont la fréquence absolue cumulée est 15. Et une fois qu’on connaît l’intervalle quartile, on utilise le deuxième formule de processus :

Q_k=L_i+\cfrac{\displaystyle\frac{k\cdot (n+1)}{4}-F_{i-1}}{f_i}\cdot I_i

Q_1=50+\cfrac{\displaystyle\frac{1\cdot (30+1)}{4}-7}{8}\cdot 10=50,94

Nous appliquons à nouveau la même procédure pour obtenir le deuxième quartile. Nous déterminons d’abord l’intervalle où se situe le quartile :

\cfrac{2\cdot (30+1)}{4} =15,5 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [60,70)

L’intervalle dont la fréquence absolue cumulée est immédiatement supérieure à 15,5 est [60,70), avec une fréquence absolue cumulée de 26. Le deuxième quartile est donc :

Q_2=60+\cfrac{\displaystyle\frac{2\cdot (30+1)}{4}-15}{11}\cdot 10=60,45

Et enfin, nous répétons le processus pour trouver le troisième quartile. Nous calculons d’abord l’intervalle qui contient le quartile :

\cfrac{3\cdot (30+1)}{4} =22,5 \quad \color{orange}\bm{\longrightarrow}\color{black}\quad [60,70)

La fréquence absolue cumulée immédiatement au-dessus de 23,25 est de 26, donc la plage du troisième quartile est de [60,70). On applique donc la formule pour calculer le quartile avec cet intervalle :

Q_3=60+\cfrac{\displaystyle\frac{3\cdot (30+1)}{4}-15}{11}\cdot 10=67,5

A quoi servent les quartiles ?

Les quartiles sont une mesure de position, ils sont donc utilisés pour savoir comment les données sont positionnées. Autrement dit, les valeurs des trois quartiles nous permettent de savoir si une donnée aléatoire de l’échantillon est très grande, très petite ou s’il s’agit d’une valeur moyenne.

Si nous prenons au hasard une donnée de l’échantillon, nous pouvons savoir si sa valeur est élevée ou faible en la comparant aux quartiles. Si la valeur des données aléatoires est inférieure au premier quartile, ce sera une petite valeur, mais si sa valeur est supérieure au troisième quartile, ce sera une grande valeur. De même, si la valeur desdites données est comprise entre le premier et le troisième quartile, il s’agit d’une valeur intermédiaire.

D’autre part, les quartiles sont également utilisés pour calculer d’autres mesures statistiques, telles que l’intervalle interquartile (ou intervalle interquartile), et pour réaliser des diagrammes, tels que le box and whisker plot (ou boxplot).

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *