R'de özet tablolar oluşturmanın en kolay yolu

İle Dr.benjamin anderson Temmuz 24, 2023 Rehber 0 Yorum

R’de özet tabloları oluşturmanın en kolay yolu, psych kütüphanesindeki tarif() ve tarifBy() işlevlerini kullanmaktır.

 library (psych)

#create summary table
describe(df)

#create summary table, grouped by a specific variable
describeBy(df, group=df$var_name)

Aşağıdaki örnekler bu fonksiyonların pratikte nasıl kullanılacağını göstermektedir.

Örnek 1: Temel bir özet tablosu oluşturun

R’de aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'C'),
                 points=c(15, 22, 29, 41, 30, 11, 19),
                 rebounds=c(7, 8, 6, 6, 7, 9, 13),
                 steals=c(1, 1, 2, 3, 5, 7, 5))

#view data frame
df

  team points rebounds steals
1 to 15 7 1
2 A 22 8 1
3 B 29 6 2
4 B 41 6 3
5 C 30 7 5
6 C 11 9 7
7 C 19 13 5

Veri çerçevesindeki her değişken için bir özet tablo oluşturmak amacıyla define() işlevini kullanabiliriz:

 library (psych)

#create summary table
describe(df)

         vars n mean sd median trimmed mad min max range skew kurtosis
team* 1 7 2.14 0.90 2 2.14 1.48 1 3 2 -0.22 -1.90
points 2 7 23.86 10.24 22 23.86 10.38 11 41 30 0.33 -1.41
rebounds 3 7 8.00 2.45 7 8.00 1.48 6 13 7 1.05 -0.38
steals 4 7 3.43 2.30 3 3.43 2.97 1 7 6 0.25 -1.73
           se
team* 0.34
points 3.87
rebounds 0.93
steals 0.87

Sonuçtaki her bir değerin nasıl yorumlanacağı aşağıda açıklanmıştır:

değişkenler : sütun numarası
n : Geçerli vaka sayısı
ortalama : Ortalama değer
medyan : Medyan değer
kırpılmış : Kırpılmış ortalama (varsayılan olarak her uçta gözlemlerin %10’u kaldırılır)
mad : Mutlak medyan sapma (medyandan)
min : Minimum değer
max : Maksimum değer
range : Değer aralığı (max – min)
çarpıklık : asimetri
Basıklık : Düzleşme
se : Standart hata

Yıldız işareti (*) bulunan herhangi bir değişkenin, değerlerin sayısal sırasını temsil eden değerlere sahip sayısal bir değişkene dönüştürülmüş kategorik veya mantıksal bir değişken olduğunu unutmamak önemlidir.

Örneğimizde “takım” değişkeni sayısal bir değişkene dönüştürülmüştür, dolayısıyla ilgili özet istatistikleri tam anlamıyla yorumlamamalıyız.

Ayrıca fast=TRUE bağımsız değişkenini yalnızca en yaygın özet istatistikleri hesaplamak için kullanabileceğinizi unutmayın:

 #create smaller summary table
describe(df, fast= TRUE )

         vars n mean sd min max range se
team 1 7 NaN NA Inf -Inf -Inf NA
points 2 7 23.86 10.24 11 41 30 3.87
rebounds 3 7 8.00 2.45 6 13 7 0.93
steals 4 7 3.43 2.30 1 7 6 0.87

Ayrıca veri çerçevesindeki belirli değişkenler için yalnızca özet istatistikleri hesaplamayı da seçebiliriz:

 #create summary table for just 'points' and 'rebounds' columns
describe(df[, c(' points ', ' rebounds ')], fast= TRUE )

         vars n mean sd min max range se
points 1 7 23.86 10.24 11 41 30 3.87
rebounds 2 7 8.00 2.45 6 13 7 0.93

Örnek 2: belirli değişkene göre gruplandırılmış bir özet tablosu oluşturun

Aşağıdaki kod, veri çerçevesi için “ekip” değişkenine göre gruplandırılmış bir özet tablosu oluşturmak amacıyla defineBy() işlevinin nasıl kullanılacağını gösterir:

 #create summary table, grouped by 'team' variable
describeBy(df, group=df$team, fast= TRUE )

 Descriptive statistics by group 
group: A
         vars n mean sd min max range se
team 1 2 NaN NA Inf -Inf -Inf NA
points 2 2 18.5 4.95 15 22 7 3.5
rebounds 3 2 7.5 0.71 7 8 1 0.5
steals 4 2 1.0 0.00 1 1 0 0.0
-------------------------------------------------- ---------- 
group: B
         vars n mean sd min max range se
team 1 2 NaN NA Inf -Inf -Inf NA
points 2 2 35.0 8.49 29 41 12 6.0
rebounds 3 2 6.0 0.00 6 6 0 0.0
steals 4 2 2.5 0.71 2 3 1 0.5
-------------------------------------------------- ---------- 
group: C
         vars n mean sd min max range se
team 1 3 NaN NA Inf -Inf -Inf NA
points 2 3 20.00 9.54 11 30 19 5.51
rebounds 3 3 9.67 3.06 7 13 6 1.76
steals 4 3 5.67 1.15 5 7 2 0.67

Çıktı, veri çerçevesindeki üç takımın her biri için özet istatistikleri görüntüler.

Ek kaynaklar

R’deki beş sayının özeti nasıl hesaplanır
R’de grup başına ortalama nasıl hesaplanır
R’de gruba göre toplam nasıl hesaplanır
R’deki varyans nasıl hesaplanır
R’de kovaryans matrisi nasıl oluşturulur

yazar hakkında

Dr.benjamin anderson

Merhaba, ben Benjamin, emekli bir istatistik profesörü ve Statorials öğretmenine dönüştüm. İstatistik alanındaki kapsamlı deneyimim ve uzmanlığımla, öğrencilerimi Statorials aracılığıyla güçlendirmek için bilgilerimi paylaşmaya can atıyorum. Daha fazlasını bil

Örnek 1: Temel bir özet tablosu oluşturun

Örnek 2: belirli değişkene göre gruplandırılmış bir özet tablosu oluşturun

Ek kaynaklar

yazar hakkında

Dr.benjamin anderson

Yorum ekle