Jarak Hamming antara dua vektor hanyalah jumlah elemen-elemen bersesuaian yang berbeda antar vektor. Misalnya kita mempunyai dua vektor berikut: x = [1, 2, 3, 4] y = [1, 2, 5, 7] Jarak Hamming antara dua vektor adalah 2 , karena ini...
Jarak Hamming antara dua vektor hanyalah jumlah elemen-elemen bersesuaian yang berbeda antar vektor. Misalnya kita mempunyai dua vektor berikut: x = [1, 2, 3, 4] y = [1, 2, 5, 7] Jarak Hamming antara dua vektor adalah 2 , karena ini...
Jarak Euclidean antara dua vektor A dan B dihitung sebagai berikut: Jarak Euclidean = √ Σ(A i -B i ) 2 Emas: Σ adalah simbol Yunani yang berarti “jumlah” A i adalah nilai ke-i dari vektor A B i adalah nilai...
Jarak Levenshtein antara dua string adalah jumlah minimum perubahan karakter tunggal yang diperlukan untuk mengubah satu kata menjadi kata lain. Yang dimaksud dengan “modifikasi” meliputi penggantian, penyisipan, dan penghapusan. Misalnya, kita mempunyai dua kata berikut: KE PESTA TAMAN Jarak Levenshtein antara...
Jarak Levenshtein antara dua string adalah jumlah minimum perubahan karakter tunggal yang diperlukan untuk mengubah satu kata menjadi kata lain. Yang dimaksud dengan “modifikasi” meliputi penggantian, penyisipan, dan penghapusan. Misalnya, kita mempunyai dua kata berikut: KE PESTA TAMAN Jarak Levenshtein antara...
Deviasi standar adalah salah satu cara paling umum untuk mengukur penyebaran kumpulan data. Ini dihitung sebagai berikut: Simpangan baku = √( Σ( xi – x ) 2 / n ) Cara lain untuk mengukur distribusi pengamatan dalam kumpulan data adalah deviasi...
ANOVA satu arah digunakan untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik antara rata-rata tiga atau lebih kelompok independen. Jika nilai p keseluruhan tabel ANOVA berada di bawah tingkat signifikansi tertentu, maka kita memiliki cukup bukti untuk mengatakan bahwa setidaknya...
Cara termudah untuk menghapus baris duplikat di pandas DataFrame adalah dengan menggunakan fungsi drop_duplications() , yang menggunakan sintaks berikut: df.drop_duplikat(subset=Tidak ada, simpan=’pertama’, inplace=False) Emas: subset: kolom mana yang harus diperhitungkan untuk mengidentifikasi duplikat. Standarnya adalah semua kolom. keep: Menentukan duplikat mana...
Distribusi Erlang adalah distribusi probabilitas yang awalnya dibuat oleh AK Erlang untuk memodelkan jumlah panggilan telepon yang dapat diterima oleh operator stasiun switching secara bersamaan. Distribusi digunakan dalam rekayasa lalu lintas telepon, sistem antrian, biologi matematika, dan bidang lainnya untuk memodelkan...
Perkiraan Satterthwaite adalah rumus yang digunakan untuk mencari “derajat kebebasan efektif” dalam uji-t dua sampel. Hal ini paling sering digunakan dalam uji-t Welch , yang membandingkan rata-rata dua sampel independen tanpa mengasumsikan bahwa populasi dari mana sampel diambil memiliki varian yang...