Panduan untuk dt, qt, pt, & rt di r

Distribusi t Student adalah salah satu distribusi yang paling umum digunakan dalam statistik. Tutorial ini menjelaskan cara bekerja dengan distribusi Student t di R menggunakan fungsi dt() , qt() , pt() dan rt() .

dt

Fungsi dt mengembalikan nilai fungsi kepadatan probabilitas (pdf) dari distribusi t Student dengan variabel acak tertentu x dan derajat kebebasan df . Sintaks penggunaan dt adalah sebagai berikut:

dt(x, df)

Kode berikut menunjukkan beberapa contoh aksi dt :

 #find the value of the Student t distribution pdf at x = 0 with 20 degrees of freedom
dt(x = 0, df = 20)

#[1] 0.3939886

#by default, R assumes the first argument is x and the second argument is df
dt(0, 20)

#[1] 0.3939886
#find the value of the Student t distribution pdf at x = 1 with 30 degrees of freedom
dt(1, 30)

#[1] 0.2379933

Biasanya, ketika mencoba menyelesaikan pertanyaan tentang probabilitas menggunakan distribusi t Student, Anda akan sering menggunakan pt daripada dt . Namun, penerapan dt yang berguna adalah membuat plot distribusi Student t di R. Kode berikut mengilustrasikan cara melakukannya:

 #Create a sequence of 100 equally spaced numbers between -4 and 4
x <- seq(-4, 4, length=100)

#create a vector of values that shows the height of the probability distribution
#for each value in x, using 20 degrees of freedom
y <- dt(x = x, df = 20)

#plot x and y as a scatterplot with connected lines (type = "l") and add
#an x-axis with custom labels
plot(x,y, type = "l", lwd = 2, axes = FALSE, xlab = "", ylab = "")
axis(1, at = -3:3, labels = c("-3s", "-2s", "-1s", "mean", "1s", "2s", "3s"))

Ini menghasilkan plot berikut:

pt

Fungsi pt mengembalikan nilai fungsi kepadatan kumulatif (cdf) dari distribusi t Student dengan variabel acak tertentu x dan derajat kebebasan df . Sintaks penggunaan pnorm adalah sebagai berikut:

pt(x, df)

Secara sederhana, pt mengembalikan luas di sebelah kiri nilai x tertentu dalam distribusi t Student. Jika Anda tertarik pada luas di sebelah kanan nilai x tertentu, Anda cukup menambahkan argumen lower.tail = FALSE

pt(x, df, bawah.ekor = SALAH)

Contoh berikut menggambarkan bagaimana menyelesaikan beberapa pertanyaan probabilitas menggunakan pt.

Contoh 1: Carilah luas daerah di sebelah kiri t-statistik yang bernilai -0,785 dan 14 derajat kebebasan.

 pt(-0.785, 14)

#[1] 0.2227675

Contoh 2: Carilah luas daerah di sebelah kanan t-statistik yang bernilai -0,785 dan 14 derajat kebebasan.

 #the following approaches produce equivalent results

#1 - area to the left
1 - pt(-0.785, 14)

#[1] 0.7772325

#area to the right
pt(-0.785, 14, lower.tail = FALSE)

#[1] 0.7772325 

Contoh 3: Carilah luas total pada distribusi t Student dengan 14 derajat kebebasan yang terletak di sebelah kiri -0,785 atau di sebelah kanan 0,785.

 pt (-0.785, 14) + pt (0.785, 14, lower.tail = FALSE)

#[1] 0.4455351

qt

Fungsi qt mengembalikan nilai fungsi kepadatan kumulatif terbalik (cdf) dari distribusi t Student dengan variabel acak tertentu x dan derajat kebebasan df. Sintaks penggunaan qt adalah sebagai berikut:

qt(x, df)

Secara sederhana, Anda dapat menggunakan qt untuk mencari tahu berapa skor t kuantil pth dari distribusi t Student.

Kode berikut menunjukkan beberapa contoh tindakan qt :

 #find the t-score of the 99th quantile of the Student t distribution with df = 20
qt(.99, df = 20)

#[1][1]2.527977

#find the t-score of the 95th quantile of the Student t distribution with df = 20
qt(.95, df = 20)

#[1]1.724718

#find the t-score of the 90th quantile of the Student t distribution with df = 20
qt(.9, df = 20)

#[1]1.325341

Perhatikan bahwa nilai kritis yang ditemukan oleh qt akan sesuai dengan nilai kritis yang ditemukan pada tabel distribusi t serta nilai kritis yang dapat ditemukan dengan kalkulator distribusi t terbalik.

rt

Fungsi rt menghasilkan vektor variabel acak yang mengikuti distribusi t Student dengan panjang vektor n dan derajat kebebasan df . Sintaks penggunaan rt adalah sebagai berikut:

rt(n, df)

Kode berikut menunjukkan beberapa contoh tindakan rt :

 #generate a vector of 5 random variables that follows a Student t distribution
#with df = 20
rt(n = 5, df = 20)

#[1] -1.7422445 0.9560782 0.6635823 1.2122289 -0.7052825

#generate a vector of 1000 random variables that follows a Student t distribution
#with df = 40
narrowDistribution <- rt(1000, 40)

#generate a vector of 1000 random variables that follows a Student t distribution
#with df = 5
wideDistribution <- rt(1000, 5)

#generate two histograms to view these two distributions side by side, and specify
#50 bars in histogram,
par(mfrow=c(1, 2)) #one row, two columns
hist(narrowDistribution, breaks=50, xlim = c(-6, 4)) 
hist(wideDistribution, breaks=50, xlim = c(-6, 4))

Ini menghasilkan histogram berikut:

Perhatikan bagaimana sebaran yang luas lebih luas daripada sebaran yang sempit. Memang benar, kami menetapkan bahwa derajat kebebasan dalam distribusi luas adalah 5 dibandingkan dengan 40 dalam distribusi sempit. Semakin sedikit derajat kebebasannya, maka distribusi t Student akan semakin luas.

Bacaan lebih lanjut:
Panduan untuk dnorm, pnorm, qnorm dan rnorm di R
Panduan untuk dbinom, pbinom, qbinom dan rbinom di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *