Uji F parsial digunakan untuk menentukan ada atau tidaknya perbedaan yang signifikan secara statistik antara model regresi dan versi tersarang dari model yang sama. Model bersarang hanyalah model yang berisi subkumpulan variabel prediktor dalam model regresi keseluruhan. Misalnya, kita memiliki model...
Anda dapat menggunakan sintaks berikut untuk menghapus baris yang berisi string tertentu dalam bingkai data di R: df[!grepl(' string ', df$column),] Tutorial ini memberikan beberapa contoh penggunaan praktis sintaks ini dengan bingkai data berikut di R: #create data frame df <-...
Banyak uji statistik mengasumsikan bahwa kumpulan data terdistribusi secara normal . Namun asumsi ini sering kali dilanggar dalam praktiknya. Salah satu cara untuk mengatasi masalah ini adalah dengan mentransformasikan nilai dalam kumpulan data menggunakan salah satu dari tiga transformasi berikut: 1....
Transformasi box-cox adalah metode yang umum digunakan untuk mengubah kumpulan data yang tidak terdistribusi normal menjadi kumpulan data yang lebih terdistribusi normal . Ide dasarnya adalah mencari nilai λ sedemikian rupa sehingga data yang ditransformasikan sedekat mungkin dengan distribusi normal, dengan...
Seringkali Anda mungkin ingin menyesuaikan kurva ke kumpulan data dengan Python. Contoh langkah demi langkah berikut menjelaskan cara menyesuaikan kurva ke data dengan Python menggunakan fungsi numpy.polyfit() dan cara menentukan kurva mana yang paling sesuai dengan data. Langkah 1: Buat dan...
Plot log-log adalah plot yang menggunakan skala logaritmik pada sumbu x dan sumbu y. Jenis plot ini berguna untuk memvisualisasikan dua variabel ketika hubungan sebenarnya di antara keduanya mengikuti suatu jenis hukum kekuasaan. Tutorial ini menjelaskan cara membuat plot log-log dengan...
Seringkali Anda mungkin ingin menghitung hanya jumlah baris dalam pandas DataFrame yang memenuhi kriteria tertentu. Untungnya, hal ini mudah dilakukan dengan menggunakan sintaks dasar berikut: sum(df. column_name == some_value ) Contoh berikut menunjukkan cara menggunakan sintaks ini dalam praktiknya pada bingkai...
Distribusi normal adalah distribusi probabilitas yang paling umum digunakan dalam statistik. Ini memiliki properti berikut: Simetris Berbentuk lonceng Rata-rata dan mediannya sama; keduanya terletak di pusat distribusi Rata-rata distribusi normal menentukan lokasinya dan simpangan baku menentukan penyebarannya. Misalnya, grafik berikut menunjukkan...
Bagan semi logaritma adalah jenis bagan yang menggunakan skala logaritma pada sumbu y dan skala linier pada sumbu x. Bagan jenis ini sering digunakan ketika nilai variabel y mempunyai variabilitas yang jauh lebih besar dibandingkan nilai variabel x. Hal ini sering...
Seringkali Anda mungkin ingin mengubah skala yang digunakan pada sumbu di plot R. Tutorial ini menjelaskan cara mengubah skala sumbu pada plot dasar R dan ggplot2. Contoh 1: ubah skala sumbu di database R Untuk mengubah skala sumbu pada plot berbasis...