Boosting adalah teknik pembelajaran mesin yang terbukti menghasilkan model dengan akurasi prediksi tinggi. Salah satu cara paling umum untuk menerapkan peningkatan dalam praktik adalah dengan menggunakan XGBoost , kependekan dari “peningkatan gradien ekstrem”. Tutorial ini memberikan contoh langkah demi langkah tentang...
Seringkali dalam statistik kita ingin menjawab pertanyaan seperti: Berapa rata-rata pendapatan rumah tangga di suatu kota tertentu? Berapa berat rata-rata suatu spesies penyu tertentu? Berapa rata-rata kehadiran pertandingan sepak bola perguruan tinggi? Dalam setiap skenario, kami ingin menjawab pertanyaan tentang populasi...
Koefisien korelasi Pearson mengukur hubungan linier antara dua variabel. Itu selalu mengambil nilai antara -1 dan 1 di mana: -1 menunjukkan korelasi linier negatif sempurna antara dua variabel 0 menunjukkan tidak ada korelasi linier antara dua variabel Angka 1 menunjukkan korelasi...
Untuk menormalkan nilai dalam kumpulan data antara 0 dan 100, Anda dapat menggunakan rumus berikut: z saya = ( xi – menit(x)) / (maks(x) – menit(x)) * 100 Emas: z i : nilai normalisasi ke-i dalam kumpulan data x i :...
Dalam statistik, observasi hanyalah kejadian dari sesuatu yang Anda ukur. Misalnya, Anda mengukur berat spesies penyu tertentu. Setiap kura-kura yang beratnya Anda kumpulkan dihitung sebagai satu pengamatan. Dataset berikut berisi bobot 15 penyu yang berbeda, sehingga total ada 15 observasi: Saat...
Analisis komponen utama, sering disingkat PCA, adalah teknik pembelajaran mesin tanpa pengawasan yang berupaya menemukan komponen utama – kombinasi linier dari prediktor asli – yang menjelaskan sebagian besar variasi dalam kumpulan data. Tujuan PCA adalah untuk menjelaskan sebagian besar variabilitas dalam...
ANOVA satu arah digunakan untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik antara rata-rata tiga atau lebih kelompok independen. Jika nilai p keseluruhan tabel ANOVA berada di bawah tingkat signifikansi tertentu, maka kita memiliki cukup bukti untuk mengatakan bahwa setidaknya...
ANOVA satu arah digunakan untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik antara rata-rata tiga atau lebih kelompok independen. Jika nilai p keseluruhan tabel ANOVA berada di bawah tingkat signifikansi tertentu, maka kita memiliki cukup bukti untuk mengatakan bahwa setidaknya...
Terkadang Anda mungkin ingin menambahkan array NumPy sebagai kolom baru ke DataFrame pandas. Untungnya, Anda dapat melakukannya dengan mudah menggunakan sintaks berikut: df[' new_column '] = array_name. tolist () Tutorial ini menunjukkan beberapa contoh penggunaan praktis sintaks ini. Contoh 1: Tambahkan...
Clustering adalah teknik pembelajaran mesin yang mencoba menemukan kelompok observasi dalam kumpulan data. Tujuannya adalah untuk menemukan klaster sedemikian rupa sehingga pengamatan dalam setiap klaster cukup mirip satu sama lain, sedangkan observasi dalam klaster yang berbeda sangat berbeda satu sama lain....