Aturan praktisnya , terkadang disebut aturan 68-95-99.7, menyatakan bahwa untuk kumpulan data tertentu dengan distribusi normal: 68% nilai data berada dalam satu standar deviasi mean. 95% nilai data berada dalam dua standar deviasi dari mean. 99,7% nilai data berada dalam tiga...
Kita sering menggunakan koefisien korelasi Pearson untuk menghitung korelasi antara variabel numerik kontinu. Namun kita perlu menggunakan metrik yang berbeda untuk menghitung korelasi antar variabel kategori, yaitu variabel yang mempunyai nama atau label seperti: Status perkawinan (lajang, menikah, bercerai) Status merokok...
Enkode one-hot digunakan untuk mengonversi variabel kategori ke dalam format yang dapat dengan mudah digunakan oleh algoritme pembelajaran mesin . Ide dasar dari one-hot coding adalah membuat variabel baru yang mengambil nilai 0 dan 1 untuk mewakili nilai kategorikal aslinya. Misalnya,...
Anda dapat menggunakan sintaks dasar berikut untuk membuat subplot di pustaka visualisasi data Seaborn dengan Python: #define dimensions of subplots (rows, columns) fig, axes = plt. subplots (2, 2) #create chart in each subplot sns. boxplot (data=df, x=' team ', y='...
Anda dapat menggunakan sintaks dasar berikut untuk mengekstrak bulan dari tanggal di panda: df[' month '] = pd. DatetimeIndex (df[' date_column ']). month Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya. Contoh: ekstrak bulan dari tanggal di Pandas Misalkan kita...
Banyak uji statistik mengasumsikan bahwa kumpulan data terdistribusi normal. Namun, hal ini sering kali tidak terjadi dalam praktiknya. Salah satu cara untuk mengatasi masalah ini adalah dengan mengubah distribusi nilai dalam kumpulan data menggunakan salah satu dari tiga transformasi: 1. Transformasi...
Enkode one-hot digunakan untuk mengonversi variabel kategori ke dalam format yang dapat digunakan oleh algoritme pembelajaran mesin . Ide dasar dari one-hot coding adalah membuat variabel baru yang mengambil nilai 0 dan 1 untuk mewakili nilai kategorikal aslinya. Misalnya, gambar berikut...
Korelasi polikorik digunakan untuk menghitung korelasi antar variabel ordinal. Ingatlah bahwa variabel ordinal adalah variabel yang kemungkinan nilainya bersifat kategoris dan memiliki tatanan alami. Berikut beberapa contoh variabel yang diukur pada skala ordinal: Kepuasan : Sangat tidak puas, tidak puas, netral,...
Regresi logistik adalah jenis model regresi yang dapat kita gunakan untuk memahami hubungan antara satu atau lebih variabel prediktor dan variabel respon ketika variabel responnya biner. Jika kita hanya memiliki satu variabel prediktor dan satu variabel respon, kita dapat menggunakan regresi...
Uji eksak Fisher digunakan untuk mengetahui ada atau tidaknya hubungan yang signifikan antara dua variabel kategori. Biasanya digunakan sebagai alternatif uji independensi chi-kuadrat ketika satu atau lebih jumlah sel dalam tabel 2 × 2 kurang dari 5. Saat melaporkan hasil pengujian...