Hoe cramer's v in python te berekenen
Cramer’s V is een maatstaf voor de sterkte van het verband tussen twee nominale variabelen.
Het gaat van 0 naar 1 waarbij:
- 0 geeft aan dat er geen verband bestaat tussen de twee variabelen.
- 1 geeft een sterke associatie aan tussen de twee variabelen.
Het wordt als volgt berekend:
Cramer’s V = √ (X 2 /n) / min(c-1, r-1)
Goud:
- X 2 : De Chi-kwadraatstatistiek
- n: totale steekproefomvang
- r: Aantal regels
- c: Aantal kolommen
Deze tutorial geeft enkele voorbeelden van het berekenen van Cramer’s V voor een kruistabel in Python.
Voorbeeld 1: Cramer’s V voor een 2×2 tafel
De volgende code laat zien hoe je Cramer’s V berekent voor een 2×2-tabel:
#load necessary packages and functions import scipy. stats as stats import numpy as np #create 2x2 table data = np. array ([[7,12], [9,8]]) #Chi-squared test statistic, sample size, and minimum of rows and columns X2 = stats. chi2_contingency (data, correction= False )[0] n = np. sum (data) minDim = min( data.shape )-1 #calculate Cramer's V V = np. sqrt ((X2/n) / minDim) #display Cramer's V print(V) 0.1617
Cramer’s V blijkt 0,1617 te zijn, wat duidt op een vrij zwak verband tussen de twee variabelen in de tabel.
Voorbeeld 2: Cramer’s V voor grotere tafels
Merk op dat we de CramerV- functie kunnen gebruiken om Cramer’s V te berekenen voor een array van elke grootte.
De volgende code laat zien hoe je Cramer’s V berekent voor een tabel met twee rijen en drie kolommen:
#load necessary packages and functions import scipy. stats as stats import numpy as np #create 2x2 table data = np. array ([[6,9], [8, 5], [12, 9]]) #Chi-squared test statistic, sample size, and minimum of rows and columns X2 = stats. chi2_contingency (data, correction= False )[0] n = np. sum (data) minDim = min( data.shape )-1 #calculate Cramer's V V = np. sqrt ((X2/n) / minDim) #display Cramer's V print(V) 0.1775
Cramer’s V blijkt 0,1775 te zijn.
Merk op dat dit voorbeeld een tabel met 2 rijen en 3 kolommen gebruikte, maar exact dezelfde code werkt voor een tabel van welke dimensie dan ook.
Aanvullende bronnen
Chi Square-onafhankelijkheidstest in Python
Chi-kwadraat goodness-of-fit-test in Python
Fisher’s exacte test in Python