Data panjang atau lebar: apa bedanya?


Kumpulan data dapat ditulis dalam dua format berbeda: wide dan long .

Format lebar berisi nilai yang tidak terulang di kolom pertama.

Format panjang berisi nilai yang berulang di kolom pertama.

Misalnya, pertimbangkan dua himpunan data berikut yang berisi data yang sama persis dan dinyatakan dalam format berbeda:

Format data lebar atau panjang

Perhatikan bahwa dalam kumpulan data yang diperluas , setiap nilai di kolom pertama bersifat unik.

Sebaliknya, pada kumpulan data panjang , nilai pada kolom pertama berulang.

Kedua kumpulan data berisi informasi tim yang sama persis, namun hanya dinyatakan dalam format berbeda.

Kapan menggunakan data lebar atau panjang

Bergantung pada apa yang ingin Anda lakukan dengan data Anda, mungkin lebih masuk akal untuk menyajikannya dalam format lebar atau panjang.

Kapan menggunakan format besar

Sebagai aturan umum, jika Anda menganalisis data, biasanya Anda akan menggunakan format data yang luas .

Misalnya, jika Anda ingin mengetahui rata-rata poin, assist, dan rebound yang dicetak oleh sebuah tim, seringkali lebih mudah untuk memiliki data dalam format besar:

Sebagian besar kumpulan data yang Anda temui di dunia nyata juga akan disimpan dalam format lebar karena lebih mudah diinterpretasikan oleh otak kita.

Misalnya pada format di atas, mudah untuk membaca nilai poin, assist, dan rebound setiap tim di baris yang sama.

Kapan menggunakan format panjang

Biasanya, jika Anda melihat beberapa variabel dalam sebuah plot menggunakan perangkat lunak statistik seperti R , Anda biasanya perlu mengonversi data Anda ke format yang panjang agar perangkat lunak tersebut dapat membuat plot.

Untuk contoh nyata, lihat tutorial R berikut ini yang mengharuskan data dalam format panjang untuk membuat jenis plot tertentu:

Terkadang Anda mungkin perlu membentuk ulang data Anda ke dalam format yang berbeda jika Anda juga menggunakan Python .

Tutorial berikut menjelaskan cara membentuk ulang bingkai data dengan Python:

Sumber daya tambahan

Tutorial berikut memberikan informasi tentang istilah statistik lain yang umum digunakan:

Apa yang dimaksud dengan observasi dalam statistik?
Apa yang dimaksud dengan kovariat dalam statistik?
Apa yang dimaksud dengan residu dalam statistik?

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *