So berechnen sie cramers v in python
Cramers V ist ein Maß für die Stärke der Assoziation zwischen zwei nominalen Variablen.
Es geht von 0 auf 1, wobei:
- 0 bedeutet, dass zwischen den beiden Variablen kein Zusammenhang besteht.
- 1 weist auf einen starken Zusammenhang zwischen den beiden Variablen hin.
Es wird wie folgt berechnet:
Cramers V = √ (X 2 /n) / min(c-1, r-1)
Gold:
- X 2 : Die Chi-Quadrat-Statistik
- n: Gesamtstichprobengröße
- r: Anzahl der Zeilen
- c: Anzahl der Spalten
Dieses Tutorial enthält einige Beispiele für die Berechnung von Cramer’s V für eine Kontingenztabelle in Python.
Beispiel 1: Cramers V für eine 2×2-Tabelle
Der folgende Code zeigt, wie man Cramers V für eine 2×2-Tabelle berechnet:
#load necessary packages and functions import scipy. stats as stats import numpy as np #create 2x2 table data = np. array ([[7,12], [9,8]]) #Chi-squared test statistic, sample size, and minimum of rows and columns X2 = stats. chi2_contingency (data, correction= False )[0] n = np. sum (data) minDim = min( data.shape )-1 #calculate Cramer's V V = np. sqrt ((X2/n) / minDim) #display Cramer's V print(V) 0.1617
Es stellt sich heraus, dass Cramers V 0,1617 beträgt, was auf eine ziemlich schwache Verbindung zwischen den beiden Variablen in der Tabelle hinweist.
Beispiel 2: Cramers V für größere Tabellen
Beachten Sie, dass wir die CramerV- Funktion verwenden können, um Cramers V für ein Array beliebiger Größe zu berechnen.
Der folgende Code zeigt, wie Cramers V für eine Tabelle mit 2 Zeilen und 3 Spalten berechnet wird:
#load necessary packages and functions import scipy. stats as stats import numpy as np #create 2x2 table data = np. array ([[6,9], [8, 5], [12, 9]]) #Chi-squared test statistic, sample size, and minimum of rows and columns X2 = stats. chi2_contingency (data, correction= False )[0] n = np. sum (data) minDim = min( data.shape )-1 #calculate Cramer's V V = np. sqrt ((X2/n) / minDim) #display Cramer's V print(V) 0.1775
Es stellt sich heraus, dass Cramers V 0,1775 beträgt.
Beachten Sie, dass in diesem Beispiel eine Tabelle mit 2 Zeilen und 3 Spalten verwendet wurde, der exakt gleiche Code jedoch für eine Tabelle beliebiger Dimensionen funktioniert.
Zusätzliche Ressourcen
Chi-Quadrat-Unabhängigkeitstest in Python
Chi-Quadrat-Anpassungstest in Python
Fishers genauer Test in Python