Dalam statistik, skor-z memberi tahu kita berapa banyak standar deviasi suatu nilai tertentu dari mean . Kami menggunakan rumus berikut untuk menghitung skor-z: z = (X – μ) / σ Emas: X adalah nilai data mentah tunggal μ adalah rata-rata σ...
Dalam statistik, mean absolute error (MAE) adalah cara untuk mengukur keakuratan model tertentu. Ini dihitung sebagai berikut: MAE = (1/n) * Σ|y saya – x saya | Emas: Σ: Simbol Yunani yang berarti “jumlah” y i : Nilai observasi untuk observasi...
Dalam statistik, proporsi populasi mengacu pada persentase individu dalam suatu populasi dengan karakteristik tertentu. Misalnya, 43,8% penduduk di kota tertentu mendukung undang-undang baru. Nilai 0,438 mewakili proporsi populasi. Rumus proporsi penduduk Proporsi populasi selalu antara 0 dan 1 (atau 0% hingga...
Dalam suatu distribusi frekuensi, batas kelas merupakan nilai-nilai yang memisahkan kelas-kelas. Kami menggunakan langkah-langkah berikut untuk menghitung batas kelas dalam distribusi frekuensi: 1. Kurangi batas atas kelas pertama dengan batas bawah kelas kedua. 2. Bagilah hasilnya dengan dua. 3. Kurangi hasilnya...
Histogram adalah grafik yang membantu kita memvisualisasikan distribusi nilai dalam sekumpulan data. Ternyata jumlah kotak yang digunakan dalam histogram bisa berdampak besar pada cara kita menafsirkan data. Jika kita menggunakan terlalu sedikit kelompok, pola dasar sebenarnya dalam data dapat disembunyikan: Dan...
Skewness adalah cara untuk menggambarkan simetri suatu distribusi. Suatu distribusi dianggap miring jika mempunyai “ekor” di sisi kiri distribusi: Suatu distribusi dikatakan miring ke kanan jika mempunyai “ekor” di sisi kanan distribusi: Dan suatu distribusi tidak memiliki bias jika kedua sisinya...
Fungsi pandas fillna() berguna untuk mengisi nilai yang hilang pada kolom pandas DataFrame. Tutorial ini memberikan beberapa contoh penggunaan fungsi ini untuk mengisi nilai yang hilang untuk beberapa kolom di pandas DataFrame berikut: import pandas as pd import numpy as np...
Uji tren Mann-Kendall digunakan untuk mengetahui ada atau tidaknya tren pada data deret waktu. Ini adalah uji non-parametrik, artinya tidak ada asumsi mendasar yang dibuat mengenai normalitas data. Hipotesis pengujiannya adalah sebagai berikut: H 0 (hipotesis nol): tidak ada tren dalam...
Peta panas adalah jenis bagan yang menggunakan corak warna berbeda untuk mewakili nilai data. Tutorial ini menjelaskan cara membuat peta panas menggunakan pustaka visualisasi Seaborn Python dengan kumpulan data berikut: #import seaborn import seaborn as sns #load "flights" dataset data =...
Barplot adalah jenis bagan yang menampilkan nilai numerik dari berbagai variabel kategori. Tutorial ini menjelaskan cara membuat peta panas menggunakan pustaka visualisasi Python Seaborn dengan kumpulan data tips bawaan: import seaborn as sns #load tips dataset data = sns. load_dataset (“...