So berechnen sie cramers v in python


Cramers V ist ein Maß für die Stärke der Assoziation zwischen zwei nominalen Variablen.

Es geht von 0 auf 1, wobei:

  • 0 bedeutet, dass zwischen den beiden Variablen kein Zusammenhang besteht.
  • 1 weist auf einen starken Zusammenhang zwischen den beiden Variablen hin.

Es wird wie folgt berechnet:

Cramers V = √ (X 2 /n) / min(c-1, r-1)

Gold:

  • X 2 : Die Chi-Quadrat-Statistik
  • n: Gesamtstichprobengröße
  • r: Anzahl der Zeilen
  • c: Anzahl der Spalten

Dieses Tutorial enthält einige Beispiele für die Berechnung von Cramer’s V für eine Kontingenztabelle in Python.

Beispiel 1: Cramers V für eine 2×2-Tabelle

Der folgende Code zeigt, wie man Cramers V für eine 2×2-Tabelle berechnet:

 #load necessary packages and functions
import scipy. stats as stats
import numpy as np

#create 2x2 table
data = np. array ([[7,12], [9,8]])

#Chi-squared test statistic, sample size, and minimum of rows and columns
X2 = stats. chi2_contingency (data, correction= False )[0]
n = np. sum (data)
minDim = min( data.shape )-1

#calculate Cramer's V
V = np. sqrt ((X2/n) / minDim)

#display Cramer's V
print(V)

0.1617

Es stellt sich heraus, dass Cramers V 0,1617 beträgt, was auf eine ziemlich schwache Verbindung zwischen den beiden Variablen in der Tabelle hinweist.

Beispiel 2: Cramers V für größere Tabellen

Beachten Sie, dass wir die CramerV- Funktion verwenden können, um Cramers V für ein Array beliebiger Größe zu berechnen.

Der folgende Code zeigt, wie Cramers V für eine Tabelle mit 2 Zeilen und 3 Spalten berechnet wird:

 #load necessary packages and functions
import scipy. stats as stats
import numpy as np

#create 2x2 table
data = np. array ([[6,9], [8, 5], [12, 9]])

#Chi-squared test statistic, sample size, and minimum of rows and columns
X2 = stats. chi2_contingency (data, correction= False )[0]
n = np. sum (data)
minDim = min( data.shape )-1

#calculate Cramer's V
V = np. sqrt ((X2/n) / minDim)

#display Cramer's V
print(V)

0.1775

Es stellt sich heraus, dass Cramers V 0,1775 beträgt.

Beachten Sie, dass in diesem Beispiel eine Tabelle mit 2 Zeilen und 3 Spalten verwendet wurde, der exakt gleiche Code jedoch für eine Tabelle beliebiger Dimensionen funktioniert.

Zusätzliche Ressourcen

Chi-Quadrat-Unabhängigkeitstest in Python
Chi-Quadrat-Anpassungstest in Python
Fishers genauer Test in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert