Qual è la condizione pass/fail nelle statistiche?


Una prova Bernoulli è un esperimento con solo due possibili esiti – “successo” o “fallimento” – e la probabilità di successo è la stessa ogni volta che l’esperimento viene condotto.

Un esempio di saggio di Bernoulli è il lancio di una moneta. La moneta può atterrare solo su due teste (potremmo chiamare testa un “colpo” e croce un “fallimento”) e la probabilità di successo su ogni lancio è 0,5, presupponendo che la moneta sia giusta.

Spesso in statistica, quando vogliamo calcolare le probabilità che coinvolgono più di alcune prove di Bernoulli, utilizziamo la distribuzione normale come approssimazione. Tuttavia, per fare ciò dobbiamo verificare che la condizione pass/fail sia soddisfatta:

Condizione di superamento/fallimento: devono esserci almeno 10 successi attesi e 10 fallimenti attesi in un campione per poter utilizzare la distribuzione normale come approssimazione.

Scritto in notazione, dobbiamo verificare le seguenti due cose:

  • Il numero atteso di successi è almeno 10: np ≥ 10
  • Il numero atteso di fallimenti è almeno 10: n(1-p) ≥ 10

dove n è la dimensione del campione e p è la probabilità di successo di un dato esperimento.

Nota: alcuni manuali dicono invece che sono necessari solo 5 successi attesi e 5 fallimenti attesi per utilizzare l’approssimazione normale. Tuttavia, 10 è più comunemente usato ed è un numero più conservativo. Quindi useremo questo numero in questo tutorial.

Esempio: controllo della condizione pass/fail

Supponiamo di voler creare un intervallo di confidenza per la percentuale di residenti in una contea che sono favorevoli ad una determinata legge. Selezioniamo un campione casuale di 100 residenti e chiediamo loro quale sia la loro posizione rispetto alla legge. Ecco i risultati:

  • Dimensione del campione n = 100
  • Proporzione a favore della legge p = 0,56

Vorremmo utilizzare la seguente formula per calcolare l’intervallo di confidenza:

Intervallo di confidenza = p +/- z*√ p(1-p) / n

Oro:

  • p: proporzione del campione
  • z: il valore z che corrisponde alla distribuzione normale
  • n: dimensione del campione

Questa formula utilizza il valore az della distribuzione normale. Quindi in questa formula usiamo la distribuzione normale per approssimare la distribuzione binomiale.

Tuttavia, per fare ciò dobbiamo verificare che la condizione pass/fail sia soddisfatta. Controlliamo che il numero di successi e il numero di fallimenti nel campione siano almeno 10:

Numero di successi: np = 100*.56 = 56

Numero di fallimenti: n(1-p) = 100*(1-.56) = 44

Entrambi i numeri sono uguali o superiori a 10, quindi possiamo utilizzare la formula sopra per calcolare l’intervallo di confidenza.

Risorse addizionali

Un’altra condizione che deve essere soddisfatta per utilizzare la distribuzione normale come approssimazione della distribuzione binomiale è che la dimensione del campione con cui stiamo lavorando non superi il 10% della dimensione della popolazione. Questa è chiamata la condizione del 10%.

Tieni inoltre presente che se stai lavorando con due proporzioni (ad esempio creando un intervallo di confidenza per la differenza tra le proporzioni ), devi verificare che il numero previsto di successi e fallimenti nei due campioni sia almeno 10.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *