R'de dt, qt, pt ve rt için kılavuz

Öğrenci t dağılımı istatistikte en sık kullanılan dağılımlardan biridir. Bu eğitimde R’de dt() , qt() , pt() ve rt() işlevlerini kullanarak Öğrenci t dağıtımıyla nasıl çalışılacağı açıklanmaktadır.

dt

dt işlevi, belirli bir rastgele değişken x ve df serbestlik derecesi verildiğinde Öğrencinin t dağılımının olasılık yoğunluk fonksiyonunun (pdf) değerini döndürür. dt’yi kullanmanın sözdizimi aşağıdaki gibidir:

dt(x, df)

Aşağıdaki kod, dt’nin eylem halindeki bazı örneklerini göstermektedir:

 #find the value of the Student t distribution pdf at x = 0 with 20 degrees of freedom
dt(x = 0, df = 20)

#[1] 0.3939886

#by default, R assumes the first argument is x and the second argument is df
dt(0, 20)

#[1] 0.3939886
#find the value of the Student t distribution pdf at x = 1 with 30 degrees of freedom
dt(1, 30)

#[1] 0.2379933

Tipik olarak, Öğrencinin t dağılımını kullanarak olasılık hakkındaki soruları çözmeye çalışırken genellikle dt yerine pt kullanırsınız. Ancak dt’nin yararlı bir uygulaması, R’de bir Öğrenci t dağılım grafiği oluşturmaktır. Aşağıdaki kod bunun nasıl yapılacağını göstermektedir:

 #Create a sequence of 100 equally spaced numbers between -4 and 4
x <- seq(-4, 4, length=100)

#create a vector of values that shows the height of the probability distribution
#for each value in x, using 20 degrees of freedom
y <- dt(x = x, df = 20)

#plot x and y as a scatterplot with connected lines (type = "l") and add
#an x-axis with custom labels
plot(x,y, type = "l", lwd = 2, axes = FALSE, xlab = "", ylab = "")
axis(1, at = -3:3, labels = c("-3s", "-2s", "-1s", "mean", "1s", "2s", "3s"))

Bu, aşağıdaki grafiği oluşturur:

puan

pt işlevi, belirli bir rastgele değişken x ve serbestlik derecesi df verildiğinde Öğrencinin t dağılımının kümülatif yoğunluk fonksiyonunun (cdf) değerini döndürür. pnorm’u kullanmanın sözdizimi aşağıdaki gibidir:

pt(x, df)

Basit bir ifadeyle pt , Öğrenci t dağılımında belirli bir x değerinin solundaki alanı döndürür. Belirli bir x değerinin sağındaki alanla ilgileniyorsanız, basitçe less.tail = FALSE argümanını ekleyebilirsiniz.

pt(x, df, alt.kuyruk = YANLIŞ)

Aşağıdaki örneklerde bazı olasılık sorularının pt kullanılarak nasıl çözüleceği gösterilmektedir.

Örnek 1: -0,785 değerine ve 14 serbestlik derecesine sahip bir t istatistiğinin solundaki alanı bulun.

 pt(-0.785, 14)

#[1] 0.2227675

Örnek 2: -0,785 değerine ve 14 serbestlik derecesine sahip bir t istatistiğinin sağındaki alanı bulun.

 #the following approaches produce equivalent results

#1 - area to the left
1 - pt(-0.785, 14)

#[1] 0.7772325

#area to the right
pt(-0.785, 14, lower.tail = FALSE)

#[1] 0.7772325 

Örnek 3: -0,785’in solunda veya 0,785’in sağında yer alan 14 serbestlik derecesine sahip Öğrenci t dağılımındaki toplam alanı bulun.

 pt (-0.785, 14) + pt (0.785, 14, lower.tail = FALSE)

#[1] 0.4455351

qt

qt fonksiyonu, belirli bir rastgele değişken x ve serbestlik derecesi df verildiğinde, Öğrencinin t dağılımının ters kümülatif yoğunluk fonksiyonunun (cdf) değerini döndürür. Qt kullanmanın sözdizimi aşağıdaki gibidir:

qt(x, df)

Basit bir ifadeyle, Öğrencinin t dağılımının p’inci yüzdelik bölümünün t puanının ne olduğunu bulmak için qt’yi kullanabilirsiniz.

Aşağıdaki kod, qt’nin eylem halindeki bazı örneklerini gösterir:

 #find the t-score of the 99th quantile of the Student t distribution with df = 20
qt(.99, df = 20)

#[1][1]2.527977

#find the t-score of the 95th quantile of the Student t distribution with df = 20
qt(.95, df = 20)

#[1]1.724718

#find the t-score of the 90th quantile of the Student t distribution with df = 20
qt(.9, df = 20)

#[1]1.325341

Qt tarafından bulunan kritik değerlerin, t dağılım tablosunda bulunan kritik değerlerin yanı sıra ters t dağılımı hesaplayıcısı tarafından bulunabilecek kritik değerlere de karşılık geleceğini unutmayın.

rt

rt fonksiyonu, n vektör uzunluğu ve df serbestlik derecesi verildiğinde Öğrenci t dağılımını takip eden rastgele değişkenlerden oluşan bir vektör üretir. rt kullanmanın sözdizimi aşağıdaki gibidir:

rt(n, df)

Aşağıdaki kod, rt’nin eylem halindeki bazı örneklerini gösterir:

 #generate a vector of 5 random variables that follows a Student t distribution
#with df = 20
rt(n = 5, df = 20)

#[1] -1.7422445 0.9560782 0.6635823 1.2122289 -0.7052825

#generate a vector of 1000 random variables that follows a Student t distribution
#with df = 40
narrowDistribution <- rt(1000, 40)

#generate a vector of 1000 random variables that follows a Student t distribution
#with df = 5
wideDistribution <- rt(1000, 5)

#generate two histograms to view these two distributions side by side, and specify
#50 bars in histogram,
par(mfrow=c(1, 2)) #one row, two columns
hist(narrowDistribution, breaks=50, xlim = c(-6, 4)) 
hist(wideDistribution, breaks=50, xlim = c(-6, 4))

Bu, aşağıdaki histogramları oluşturur:

Geniş dağılımın dar dağılımdan nasıl daha geniş olduğuna dikkat edin. Nitekim geniş dağılımda serbestlik derecesinin 5, dar dağılımda ise 40 olduğunu belirtmiştik. Serbestlik derecesi ne kadar az olursa, Öğrencinin t dağılımı o kadar geniş olacaktır.

Daha fazla okuma:
R’de dnorm, pnorm, qnorm ve rnorm kılavuzu
R’de dbinom, pbinom, qbinom ve rbinom için bir rehber

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir