Penjelasan sederhana tentang cara menafsirkan varians


Dalam statistik, kita sering kali ingin memahami bagaimana nilai-nilai “tersebar” dalam suatu kumpulan data. Untuk mengukurnya, kita sering menggunakan ukuran dispersi berikut:

  • Range: selisih antara nilai terbesar dan terkecil dalam suatu kumpulan data.
  • Rentang interkuartil: selisih antara kuartil pertama dan kuartil ketiga suatu kumpulan data (kuartil hanyalah nilai yang membagi kumpulan data menjadi empat bagian yang sama).
  • Deviasi standar: cara mengukur jarak tipikal antara nilai dan mean.
  • Varians: deviasi standar kuadrat.

Dari keempat ukuran tersebut, varians cenderung menjadi yang paling sulit dipahami secara intuitif. Artikel ini bertujuan untuk memberikan penjelasan sederhana mengenai varians.

Memahami Deviasi Standar

Sebelum kita memahami varians, pertama-tama kita harus memahami simpangan baku , yang biasanya dilambangkan dengan σ .

Rumus untuk menghitung simpangan baku adalah:

σ = √(Σ ( xi – μ) 2 / N)

dimana μ adalah rata-rata populasi, x i adalah elemen ke-i dari populasi, N adalah ukuran populasi, dan Σ hanyalah sebuah simbol indah yang berarti “jumlah”.

Dalam praktiknya, Anda jarang perlu menghitung deviasi standar dengan tangan; sebagai gantinya, Anda dapat menggunakan perangkat lunak statistik atau kalkulator.

Pada tingkat paling dasar, deviasi standar memberi tahu kita distribusi nilai data dalam kumpulan data. Untuk mengilustrasikannya, pertimbangkan tiga kumpulan data berikut beserta standar deviasinya:

[5, 5, 5] standar deviasi = 0 (tidak ada spread sama sekali)

[3, 5, 7] standar deviasi = 1,63 (beberapa deviasi)

[1, 5, 99] standar deviasi = 45,28 (spread banyak)

Istilah “deviasi standar” dapat dipahami dengan melihat dua kata yang menyusunnya:

  • “deviasi” – ini mengacu pada jarak dari rata-rata.
  • “standar” – ini mengacu pada jarak “standar” atau “tipikal” antara nilai dan mean.

Setelah Anda memahami deviasi standar, akan lebih mudah untuk memahami varians.

Memahami Kesenjangan

Variansnya, biasanya dilambangkan dengan σ2 , hanyalah deviasi standar yang dikuadratkan. Rumus untuk mencari varians suatu kumpulan data adalah:

σ 2 = Σ ( xi – μ) 2 / N

dimana μ adalah rata-rata populasi, x i adalah elemen ke-i dari populasi, N adalah ukuran populasi, dan Σ hanyalah sebuah simbol indah yang berarti “jumlah”.

Jadi, jika simpangan baku suatu kumpulan data adalah 8, maka variasinya adalah 8 2 = 64.

Atau, jika simpangan baku suatu kumpulan data adalah 10, maka variasinya adalah 10 2 = 100.

Atau, jika simpangan baku suatu kumpulan data adalah 3,7, maka variasinya adalah 3,7 · 2 = 13,69.

Semakin tersebar nilai-nilai dalam suatu kumpulan data, semakin tinggi variansnya. Untuk mengilustrasikannya, pertimbangkan tiga kumpulan data berikut beserta variansinya yang sesuai:

[5, 5, 5] varians = 0 (tidak ada spread sama sekali)

[3, 5, 7] varians = 2,67 (beberapa deviasi)

[1, 5, 99] varians = 2.050,67 (banyak spread)

Kapan Anda akan menggunakan varians dan bukan deviasi standar?

Setelah membaca penjelasan tentang deviasi standar dan varians di atas, Anda mungkin bertanya-tanya kapan Anda akan menggunakan varians alih-alih deviasi standar untuk mendeskripsikan kumpulan data.

Lagi pula, deviasi standar memberi tahu kita jarak rata-rata antara suatu nilai dan rata-rata, sedangkan varians memberi tahu kita kuadrat dari nilai tersebut. Tampaknya simpangan baku lebih mudah dipahami dan diinterpretasikan.

Pada kenyataannya, Anda hampir selalu menggunakan deviasi standar untuk menggambarkan distribusi nilai dalam kumpulan data.

Namun, varians dapat berguna ketika menggunakan teknik seperti ANOVA atau regresi dan mencoba menjelaskan varians total suatu model karena faktor-faktor tertentu.

Misalnya, Anda mungkin ingin memahami seberapa besar varians dalam nilai ujian yang dapat dijelaskan oleh IQ dan seberapa besar varians yang dapat dijelaskan oleh jam belajar.

Jika 36% variasi disebabkan oleh IQ dan 64% disebabkan oleh jam belajar, hal ini mudah dimengerti. Namun jika kita menggunakan standar deviasi 6 dan 8, hasilnya kurang intuitif dan tidak masuk akal dalam konteks masalahnya.

Kasus lain di mana lebih baik menggunakan varians daripada deviasi standar adalah ketika Anda melakukan pekerjaan statistik teoretis.

Dalam hal ini, akan lebih mudah menggunakan varians saat menghitung karena Anda tidak perlu menggunakan tanda akar kuadrat.

Sumber daya tambahan

Tutorial berikut memberikan informasi tambahan tentang varians:

Varians sampel dan varians populasi: apa bedanya?
Cara Menghitung Varians Sampel dan Populasi di Excel

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *