Covariance.p vs covariance.s in excel: qual è la differenza?
In statistica, la covarianza è un modo per misurare come i cambiamenti in una variabile sono associati ai cambiamenti in un’altra variabile.
Un valore di covarianza positivo indica che un aumento di una variabile è associato a un aumento di un’altra variabile.
Un valore negativo indica che un aumento di una variabile è associato a una diminuzione di un’altra variabile.
Esistono due diverse funzioni che puoi utilizzare per calcolare la covarianza in Excel:
1. COVARIANZA.P: questa funzione calcola la covarianza della popolazione. Utilizzare questa funzione quando l’intervallo di valori rappresenta l’intera popolazione.
Questa funzione utilizza la seguente formula:
Covarianza della popolazione = Σ(x i – x )(y i – y ) / n
Oro:
- Σ: simbolo greco che significa “somma”
- x i : l’i- esimo valore della variabile x
- x : il valore medio della variabile x
- y i : l’ i-esimo valore della variabile y
- y : il valore medio della variabile y
- n: il numero totale di osservazioni
2. COVARIANZA.S: questa funzione calcola la covarianza del campione. Utilizzare questa funzione quando l’intervallo di valori rappresenta un campione di valori anziché un’intera popolazione.
Questa funzione utilizza la seguente formula:
Covarianza campionaria = Σ(x i – x )(y i – y ) / (n-1)
Oro:
- Σ: simbolo greco che significa “somma”
- x i : l’i- esimo valore della variabile x
- x : il valore medio della variabile x
- y i : l’ i-esimo valore della variabile y
- y : il valore medio della variabile y
- n: il numero totale di osservazioni
Notare la sottile differenza tra le due formule: COVARIANCE.P divide per n mentre COVARIANCE.S divide per n-1 .
Per questo motivo, la formula COVARIANZA.S produrrà sempre un valore maggiore perché divide per un valore minore.
L’esempio seguente mostra come utilizzare ciascuna formula nella pratica.
Esempio: COVARIANZA.P vs COVARIANZA.S in Excel
Supponiamo di avere il seguente set di dati in Excel che mostra i punti e gli assist di 15 diversi giocatori di basket:
La schermata seguente mostra come calcolare la covarianza tra punti e assist utilizzando le due diverse formule di covarianza:
La covarianza del campione risulta essere 15,69 e la covarianza della popolazione risulta essere 14,64 .
Come accennato in precedenza, la covarianza del campione sarà sempre maggiore della covarianza della popolazione.
Quando utilizzare COVARIANCE.P o COVARIANCE.S
Nella maggior parte dei casi non siamo in grado di raccogliere dati per un’intera popolazione. Raccogliamo quindi dati solo per un campione della popolazione.
Pertanto, utilizziamo quasi sempre COVARIANCE.S per calcolare la covarianza di un set di dati perché il nostro set di dati rappresenta generalmente un campione.
Nei rari casi in cui i tuoi dati rappresentano un’intera popolazione, puoi invece utilizzare la funzione COVARIANZA.P .
Risorse addizionali
I seguenti tutorial spiegano la differenza tra le altre funzioni di Excel comunemente utilizzate:
DEV.ST.P vs DEV.ST.S in Excel: qual è la differenza?
PERCENTILE.EXC vs PERCENTILE.INC in Excel: qual è la differenza?
QUARTILE.EXC vs QUARTILE.INC in Excel: qual è la differenza?