Cara termudah untuk membuat tabel ringkasan di r


Cara termudah untuk membuat tabel ringkasan di R adalah dengan menggunakan fungsi deskripsikan() dan deskripsikanBy() dari perpustakaan psikis .

 library (psych)

#create summary table
describe(df)

#create summary table, grouped by a specific variable
describeBy(df, group=df$var_name)

Contoh berikut menunjukkan cara menggunakan fungsi-fungsi ini dalam praktik.

Contoh 1: Buat tabel ringkasan dasar

Misalkan kita memiliki bingkai data berikut di R:

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'C'),
                 points=c(15, 22, 29, 41, 30, 11, 19),
                 rebounds=c(7, 8, 6, 6, 7, 9, 13),
                 steals=c(1, 1, 2, 3, 5, 7, 5))

#view data frame
df

  team points rebounds steals
1 to 15 7 1
2 A 22 8 1
3 B 29 6 2
4 B 41 6 3
5 C 30 7 5
6 C 11 9 7
7 C 19 13 5

Kita dapat menggunakan fungsideskripsikan () untuk membuat tabel ringkasan untuk setiap variabel dalam bingkai data:

 library (psych)

#create summary table
describe(df)

         vars n mean sd median trimmed mad min max range skew kurtosis
team* 1 7 2.14 0.90 2 2.14 1.48 1 3 2 -0.22 -1.90
points 2 7 23.86 10.24 22 23.86 10.38 11 41 30 0.33 -1.41
rebounds 3 7 8.00 2.45 7 8.00 1.48 6 13 7 1.05 -0.38
steals 4 7 3.43 2.30 3 3.43 2.97 1 7 6 0.25 -1.73
           se
team* 0.34
points 3.87
rebounds 0.93
steals 0.87

Berikut cara menafsirkan setiap nilai dalam hasil:

  • vars : nomor kolom
  • n : Jumlah kasus yang valid
  • rata-rata : Nilai rata-rata
  • median : Nilai median
  • trimmed : Rata-rata yang dipangkas (secara default, 10% observasi dihapus di setiap ujung)
  • gila : Deviasi median absolut (dari median)
  • min : Nilai minimum
  • max : Nilai maksimum
  • range : Rentang nilai (maks – min)
  • miring : asimetri
  • kurtosis : Merata
  • se : Kesalahan standar

Penting untuk dicatat bahwa variabel apa pun dengan tanda bintang (*) adalah variabel kategorikal atau logis yang telah diubah menjadi variabel numerik dengan nilai yang mewakili urutan nilai numerik.

Dalam contoh kita, variabel “tim” telah diubah menjadi variabel numerik, jadi kita tidak boleh menafsirkan ringkasan statistik terkait secara harfiah.

Perhatikan juga bahwa Anda dapat menggunakan argumen fast=TRUE untuk menghitung hanya statistik ringkasan yang paling umum:

 #create smaller summary table
describe(df, fast= TRUE )

         vars n mean sd min max range se
team 1 7 NaN NA Inf -Inf -Inf NA
points 2 7 23.86 10.24 11 41 30 3.87
rebounds 3 7 8.00 2.45 6 13 7 0.93
steals 4 7 3.43 2.30 1 7 6 0.87

Kita juga dapat memilih untuk hanya menghitung statistik ringkasan untuk variabel tertentu dalam kerangka data:

 #create summary table for just 'points' and 'rebounds' columns
describe(df[, c(' points ', ' rebounds ')], fast= TRUE )

         vars n mean sd min max range se
points 1 7 23.86 10.24 11 41 30 3.87
rebounds 2 7 8.00 2.45 6 13 7 0.93

Contoh 2: membuat tabel ringkasan, dikelompokkan berdasarkan variabel tertentu

Kode berikut menunjukkan cara menggunakan fungsi deskripsiBy() untuk membuat tabel ringkasan untuk bingkai data, yang dikelompokkan berdasarkan variabel “tim”:

 #create summary table, grouped by 'team' variable
describeBy(df, group=df$team, fast= TRUE )

 Descriptive statistics by group 
group: A
         vars n mean sd min max range se
team 1 2 NaN NA Inf -Inf -Inf NA
points 2 2 18.5 4.95 15 22 7 3.5
rebounds 3 2 7.5 0.71 7 8 1 0.5
steals 4 2 1.0 0.00 1 1 0 0.0
-------------------------------------------------- ---------- 
group: B
         vars n mean sd min max range se
team 1 2 NaN NA Inf -Inf -Inf NA
points 2 2 35.0 8.49 29 41 12 6.0
rebounds 3 2 6.0 0.00 6 6 0 0.0
steals 4 2 2.5 0.71 2 3 1 0.5
-------------------------------------------------- ---------- 
group: C
         vars n mean sd min max range se
team 1 3 NaN NA Inf -Inf -Inf NA
points 2 3 20.00 9.54 11 30 19 5.51
rebounds 3 3 9.67 3.06 7 13 6 1.76
steals 4 3 5.67 1.15 5 7 2 0.67

Outputnya menampilkan ringkasan statistik untuk masing-masing dari tiga tim dalam bingkai data.

Sumber daya tambahan

Cara menghitung rangkuman lima angka di R
Cara menghitung mean per grup di R
Cara menghitung jumlah berdasarkan kelompok di R
Cara menghitung varians di R
Cara membuat matriks kovarians di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *