Statistica non parametrica
In questo articolo spieghiamo cosa sono le statistiche non parametriche e a cosa servono. Potrai anche vedere un esempio di applicazione della statistica non parametrica e, inoltre, qual è la differenza tra statistica non parametrica e statistica parametrica.
Cosa sono le statistiche non parametriche?
La statistica non parametrica è quella branca della statistica inferenziale che studia le variabili che non si adattano a una distribuzione di probabilità o i cui parametri della distribuzione non sono definiti. Cioè, le statistiche non parametriche vengono utilizzate per variabili che non possono essere definite con modelli teorici.
Pertanto, le distribuzioni utilizzate nelle statistiche non parametriche non possono essere definite a priori, ma sono piuttosto i dati osservati a determinarle.
I metodi statistici non parametrici vengono generalmente utilizzati quando le ipotesi precedenti di determinati test non sono soddisfatte, poiché le statistiche parametriche generalmente richiedono che vengano fatte determinate ipotesi. Di seguito vedremo quali sono le differenze tra statistica non parametrica e statistica parametrica.
Pertanto, le statistiche non parametriche vengono utilizzate per studiare le popolazioni che hanno una valutazione, come le recensioni di film che ricevono da una a cinque stelle. Un’altra applicazione delle statistiche non parametriche è quando i dati hanno una classificazione ma non una chiara interpretazione numerica, come quando si valutano le preferenze.
Esempio di statistica non parametrica
Una volta vista la definizione di statistica non parametrica, vedremo un esempio della sua applicazione per comprendere appieno il concetto.
Immaginiamo di avere un campione statistico composto da 99 osservazioni e di voler determinare la probabilità del valore dell’osservazione successiva (osservazione numero 100).
Se utilizzassimo la statistica parametrica, dovremmo prima calcolare diversi parametri statistici del campione per conoscerne le caratteristiche. Potremmo quindi eseguire diversi test statistici utilizzando i parametri calcolati per determinare la probabilità del valore dell’osservazione successiva.
Tuttavia, grazie alla statistica non parametrica, possiamo conoscere informazioni sul valore successivo senza dover calcolare i parametri statistici del campione.
Ad esempio, se abbiamo un campione di 99 osservazioni, con la statistica non parametrica possiamo determinare che esiste una probabilità dell’1% che l’osservazione numero 100 sia maggiore di tutte le precedenti. In questo modo è possibile effettuare una stima non parametrica del massimo di un campione.
In breve, con la statistica non parametrica possiamo calcolare probabilità e fare stime senza bisogno di conoscere i parametri statistici del campione.
Test statistici non parametrici
I test non parametrici sono metodi statistici basati su statistiche non parametriche. Pertanto, nei test non parametrici, le variabili vengono valutate senza fare ipotesi sulle distribuzioni di probabilità.
I test non parametrici più conosciuti sono i seguenti:
- test del chi quadrato
- prova binomiale
- Wilcoxon ha firmato il test di grado
- prova mediana
- Test di Anderson-Darling
- Prova di Cochran
- Test Kappa di Cohen
- Prova di Fisher
- Prova di Friedmann
- Prova Kendall
- Test di Kolmogorov-Smirnov
- Prova di Kuiper
- Test di Mann-Whitney o test di Wilcoxon
- Prova di McNemar
- Test di Siegel-Tukey
- Prova di segno
- Test di Wald-Wolfowitz
Vantaggi e svantaggi della statistica non parametrica
Rispetto alla statistica parametrica, i vantaggi e gli svantaggi della statistica non parametrica sono i seguenti:
Vantaggio:
- La statistica non parametrica può essere applicata a dati numerici e non numerici.
- In generale, i test non parametrici non devono necessariamente soddisfare i presupposti precedenti, il che consente loro di essere utilizzati in più situazioni.
- Quando la dimensione del campione è piccola, i test non parametrici sono generalmente più rapidi da applicare.
Svantaggi:
- A volte le informazioni possono andare perse poiché i dati vengono convertiti in informazioni qualitative.
- Quando la dimensione del campione è ampia, l’esecuzione di un test non parametrico è molto laboriosa.
- I test non parametrici generalmente hanno una potenza inferiore, il che significa che è necessaria una dimensione del campione più ampia per trarre conclusioni con lo stesso livello di sicurezza.
Statistica non parametrica e statistica parametrica
Infine, riassumendo, vediamo qual è la differenza tra statistica non parametrica e statistica parametrica.
La statistica parametrica è quella branca della statistica inferenziale che presuppone che i dati possano essere modellati mediante una distribuzione di probabilità. Ad esempio, il test t di Student è un test parametrico perché utilizza la distribuzione di probabilità t di Student.
La differenza tra statistica non parametrica e statistica parametrica è se si basano o meno su modelli teorici. La statistica non parametrica studia le variabili che non si adattano alle distribuzioni di probabilità, mentre la statistica parametrica utilizza distribuzioni di probabilità definite.