Cara membuat tabel kontingensi dengan python
Tabel kontingensi adalah jenis tabel yang merangkum hubungan antara dua variabel kategori.
Untuk membuat tabel kontingensi dengan Python, kita bisa menggunakan fungsi pandas.crosstab() , yang menggunakan sintaks berikut:
pandas.crosstab(indeks, kolom)
Emas:
- indeks: nama variabel yang akan ditampilkan di baris tabel kontingensi
- kolom: nama variabel yang akan ditampilkan di kolom tabel kontingensi
Contoh langkah demi langkah berikut menunjukkan cara menggunakan fungsi ini untuk membuat tabel kontingensi dengan Python.
Langkah 1: Buat datanya
Pertama, mari kita buat kumpulan data yang menampilkan informasi tentang 20 pesanan produk berbeda, termasuk jenis produk yang dibeli (TV, komputer, atau radio) serta negara (A, B, atau C) tempat produk tersebut dibeli:
import pandas as pd #create data df = pd. DataFrame ({'Order': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20], 'Product': ['TV', 'TV', 'Comp', 'TV', 'TV', 'Comp', 'Comp', 'Comp', 'TV', 'Radio', 'TV', 'Radio', 'Radio', 'Radio', 'Comp', 'Comp', 'TV', 'TV', 'Radio', 'TV'], 'Country': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C']}) #view data df Order Product Country 0 1 TV A 1 2 TV A 2 3 Comp A 3 4 TV A 4 5 TV B 5 6 Comp B 6 7 Comp B 7 8 Comp B 8 9 TV B 9 10 Radio B 10 11 TV B 11 12 Radio B 12 13 Radio C 13 14 Radio C 14 15 Comp C 15 16 Comp C 16 17 TV C 17 18 TV C 18 19 Radio C 19 20 TV C
Langkah 2: Buat tabel kontingensi
Kode berikut menunjukkan cara membuat tabel kontingensi untuk menghitung jumlah setiap produk yang dipesan oleh setiap negara:
#create contingency table p.d. crosstab (index=df[' Country '], columns=df[' Product ']) Product Comp Radio TV Country A 1 0 3 B 3 2 3 C 2 3 3
Berikut cara menafsirkan tabel:
- Sebanyak 1 komputer dibeli di negara A.
- Sebanyak 3 komputer dibeli di negara B.
- Sebanyak 2 komputer dibeli di negara C.
- Sebanyak 0 radio dibeli di negara A.
- Sebanyak 2 radio dibeli di negara B.
- Sebanyak 3 radio dibeli di negara C.
- Sebanyak 3 televisi dibeli di negara A.
- Sebanyak 3 televisi dibeli di negara B.
- Sebanyak 3 televisi dibeli di negara C.
Langkah 3: Tambahkan total margin ke tabel kontingensi
Kita dapat menggunakan argumen margins=True untuk menambahkan total margin ke tabel kontingensi:
#add margins to contingency table p.d. crosstab (index=df[' Country '], columns=df[' Product '], margins= True ) Product Comp Radio TV All Country A 1 0 3 4 B 3 2 3 8 C 2 3 3 8 All 6 5 9 20
Cara mengartikan nilai tabel adalah sebagai berikut:
Total baris:
- Sebanyak 4 pesanan dilakukan dari negara A.
- Sebanyak 8 pesanan dilakukan dari negara B.
- Sebanyak 8 pesanan dilakukan dari negara C.
Total kolom:
- Sebanyak 6 komputer dibeli.
- Sebanyak 5 radio dibeli.
- Sebanyak 9 televisi dibeli.
Nilai di pojok kanan bawah tabel menunjukkan total 20 produk dipesan dari semua negara.
Sumber daya tambahan
Cara membuat tabel kontingensi di R
Cara Membuat Tabel Kontingensi di Excel