Hoe cramer's v in python te berekenen


Cramer’s V is een maatstaf voor de sterkte van het verband tussen twee nominale variabelen.

Het gaat van 0 naar 1 waarbij:

  • 0 geeft aan dat er geen verband bestaat tussen de twee variabelen.
  • 1 geeft een sterke associatie aan tussen de twee variabelen.

Het wordt als volgt berekend:

Cramer’s V = √ (X 2 /n) / min(c-1, r-1)

Goud:

  • X 2 : De Chi-kwadraatstatistiek
  • n: totale steekproefomvang
  • r: Aantal regels
  • c: Aantal kolommen

Deze tutorial geeft enkele voorbeelden van het berekenen van Cramer’s V voor een kruistabel in Python.

Voorbeeld 1: Cramer’s V voor een 2×2 tafel

De volgende code laat zien hoe je Cramer’s V berekent voor een 2×2-tabel:

 #load necessary packages and functions
import scipy. stats as stats
import numpy as np

#create 2x2 table
data = np. array ([[7,12], [9,8]])

#Chi-squared test statistic, sample size, and minimum of rows and columns
X2 = stats. chi2_contingency (data, correction= False )[0]
n = np. sum (data)
minDim = min( data.shape )-1

#calculate Cramer's V
V = np. sqrt ((X2/n) / minDim)

#display Cramer's V
print(V)

0.1617

Cramer’s V blijkt 0,1617 te zijn, wat duidt op een vrij zwak verband tussen de twee variabelen in de tabel.

Voorbeeld 2: Cramer’s V voor grotere tafels

Merk op dat we de CramerV- functie kunnen gebruiken om Cramer’s V te berekenen voor een array van elke grootte.

De volgende code laat zien hoe je Cramer’s V berekent voor een tabel met twee rijen en drie kolommen:

 #load necessary packages and functions
import scipy. stats as stats
import numpy as np

#create 2x2 table
data = np. array ([[6,9], [8, 5], [12, 9]])

#Chi-squared test statistic, sample size, and minimum of rows and columns
X2 = stats. chi2_contingency (data, correction= False )[0]
n = np. sum (data)
minDim = min( data.shape )-1

#calculate Cramer's V
V = np. sqrt ((X2/n) / minDim)

#display Cramer's V
print(V)

0.1775

Cramer’s V blijkt 0,1775 te zijn.

Merk op dat dit voorbeeld een tabel met 2 rijen en 3 kolommen gebruikte, maar exact dezelfde code werkt voor een tabel van welke dimensie dan ook.

Aanvullende bronnen

Chi Square-onafhankelijkheidstest in Python
Chi-kwadraat goodness-of-fit-test in Python
Fisher’s exacte test in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert