Nombre de classes (statistiques)

Cet article explique comment connaître le nombre de classes en statistiques. Vous découvrirez également comment la largeur des intervalles est calculée après avoir trouvé le nombre de classes et, en plus, vous pourrez voir plusieurs exemples concrets.

Comment calculer le nombre de classes en statistiques

Principalement, en statistique, il existe deux méthodes pour calculer le nombre idéal de classes pour un échantillon de données : la règle de Sturges, qui est une formule, et la méthode des racines, qui consiste à trouver la racine carrée du nombre total de données.

Selon l’échantillon, il est conseillé d’utiliser une méthode ou une autre. Les deux méthodes sont expliquées ci-dessous avec un exemple.

Règle de Sturges

La règle de Sturges est une règle utilisée pour calculer le nombre idéal de classes ou d’intervalles dans lesquels un ensemble de données doit être divisé. Plus précisément, la formule de la règle de Sturges indique que le nombre approprié de classes est égal à un plus le logarithme de base deux du nombre total de points de données.

c=1+\log_2(N)

c est le nombre de classes ou d’intervalles etN est le nombre total d’observations dans l’échantillon.

La plupart des calculatrices autorisent uniquement les calculs avec des logarithmes en base 10. Dans ce cas, vous pouvez utiliser cette formule équivalente :

c=1+\cfrac{\log(N)}{\log(2)}

Par exemple, si nous disposons d’un échantillon statistique de 100 observations, selon la règle de Sturges, le nombre de classes avec lesquelles les données doivent être regroupées est calculé comme suit :

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(100)\\[2ex]c=1+6,64\\[2ex]c=7,64\\[2ex]c\approx 8\end{array}

Ainsi, pour un échantillon comportant un total de 100 données, les données doivent être divisées en 8 intervalles différents.

méthode racine

Bien que la règle de Sturges soit sûrement mieux connue, une autre méthode largement utilisée en statistique pour calculer le nombre de classes consiste à calculer la racine carrée de la taille de l’échantillon.

Ainsi, une autre formule pour calculer le nombre idéal de classes est la suivante :

c=\sqrt{N}

c est le nombre de classes ou d’intervalles etN est le nombre total de données dans l’échantillon.

Par exemple, si nous avons un total de 150 données, le calcul du nombre d’intervalles dans lesquels nous devons diviser les données serait :

c=\sqrt{150}=12,25 \approx 12

La formule précédente est utilisée lorsque la taille de l’échantillon est inférieure à 200, mais lorsque nous avons 200 données ou plus, il est préférable de calculer le nombre de classes en prenant la racine cubique :

c=\sqrt[3]{N}

c est le nombre de classes ou d’intervalles etN est le nombre total de données dans l’échantillon.

Nombre de classes et largeur d’intervalle

Une fois que nous avons calculé le nombre de classes, nous pouvons calculer la largeur que devrait avoir chaque intervalle en utilisant la formule suivante :

 \text{Amplitud de intervalo}=\cfrac{\text{Rango}}{\text{N\'umero de clases}}

A titre d’exemple, un exercice est résolu ci-dessous afin que vous puissiez voir comment la largeur des intervalles est calculée.

  • Les données statistiques suivantes ont été enregistrées. Calculez le nombre de classes avec la règle de Sturges, puis déterminez la largeur de chaque intervalle.

35\ 18\ 25\ 2\ 45\ 34\ 68\ 42\ 9\ 41\ 62\ 85\ 53

21\ 4\ 86\ 50\ 32\ 71\ 59\ 29\ 12\ 38\ 91\ 63\ 7

67\ 37\ 23\ 70\ 65\ 47\ 76\ 83\ 54\ 27\ 25\ 19\ 98

Comme nous l’avons vu plus haut, pour déterminer le nombre de classes dans lesquelles les données doivent être regroupées, nous appliquons la règle de Sturges. Dans ce cas nous avons 39 données, donc dans la formule nous devons remplacer le paramètre N par 39 :

\begin{array}{l}c=1+\log_2(N)\\[2ex]c=1+\log_2(39)\\[2ex]c=1+5,28\\[2ex]c=6,28\\[2ex]c\approx 6\end{array}

Maintenant que nous connaissons le nombre approprié de classes, calculons la largeur de chaque classe. Pour ce faire, nous devons d’abord calculer la plage des exemples de données :

R=98-2=96

Et une fois que l’on connaît l’étendue de l’échantillon, on divise la valeur trouvée par le nombre de classes calculé précédemment (6) :

\text{Amplitud de intervalo}=\cfrac{96}{6}=16

La largeur de toutes les classes doit donc être de 16 unités. Par conséquent, les classes que nous pourrions réaliser sont les suivantes :

\begin{array}{l}[2,18)\\[2ex][18,34)\\[2ex][34,50)\\[2ex][50,66)\\[2ex][66,82)\\[2ex][82,98]\end{array}

Nombre de classes dans une distribution de fréquence

Enfin, il convient de noter que le calcul du nombre de classes est important lors de la réalisation d’une distribution de fréquence (ou tableau de fréquence), de cette manière vous pouvez séparer rapidement les données en différents intervalles et retrouver ensuite tous les types de fréquences de chaque intervalle. .

Au cas où vous ne savez pas de quoi il s’agit, une distribution de fréquences est un tableau qui répertorie tous les types de fréquences pour chaque intervalle. Ainsi, chaque ligne est une classe différente et chaque colonne un type de fréquence différent.

Pour voir un exemple de distribution de fréquence avec des données regroupées, cliquez sur le lien suivant :

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *