Uzun veya geniş veri: fark nedir?


Bir veri kümesi iki farklı biçimde yazılabilir: geniş ve uzun .

Geniş format, ilk sütunda tekrarlanmayan değerleri içerir.

Uzun format, ilk sütunda tekrarlanan değerleri içerir.

Örneğin, farklı formatlarda ifade edilen tamamen aynı verileri içeren aşağıdaki iki veri kümesini düşünün:

Geniş veya uzun veri formatı

Genişletilmiş veri kümesinde ilk sütundaki her değerin benzersiz olduğunu unutmayın.

Buna karşılık uzun veri setinde ilk sütundaki değerler tekrarlanır.

Her iki veri kümesi de tamamen aynı ekip bilgisini içerir, ancak bunlar yalnızca farklı formatlarda ifade edilir.

Geniş veya uzun veriler ne zaman kullanılmalı?

Verilerinizle ne yapmak istediğinize bağlı olarak onu geniş veya uzun formatta sunmak daha mantıklı olabilir.

Büyük format ne zaman kullanılmalı?

Genel bir kural olarak, verileri analiz ediyorsanız genellikle geniş bir veri formatı kullanırsınız.

Örneğin, takımların attığı ortalama sayı, asist ve ribauntları bilmek istiyorsanız, verileri geniş formatta bulundurmak genellikle daha kolaydır:

Gerçek dünyada karşılaştığınız çoğu veri seti de geniş formatta kaydedilecektir çünkü beynimizin yorumlaması daha kolaydır.

Örneğin yukarıdaki formatta her takımın sayı, asist ve ribaund değerlerini aynı satırda okumak kolaydır.

Uzun format ne zaman kullanılmalı?

Tipik olarak, R gibi bir istatistiksel yazılım kullanarak bir grafikte birden fazla değişkeni görüntülüyorsanız, yazılımın grafiği oluşturabilmesi için genellikle verilerinizi uzun bir formata dönüştürmeniz gerekir.

Gerçek dünyadan örnekler için, belirli grafik türlerini oluşturmak için verilerin uzun formatta olması gereken şu R eğitimlerine göz atın:

Bazen Python kullanıyorsanız verilerinizi farklı bir formatta yeniden şekillendirmeniz gerekebilir.

Aşağıdaki eğitimler Python’da veri çerçevelerinin nasıl yeniden şekillendirileceğini açıklamaktadır:

Ek kaynaklar

Aşağıdaki eğitimler yaygın olarak kullanılan diğer istatistiksel terimler hakkında bilgi sağlar:

İstatistikte gözlem nedir?
İstatistiklerde ortak değişken nedir?
İstatistiklerde artıklar nelerdir?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir