Cara menggunakan distribusi t dengan python
Distribusi t merupakan distribusi probabilitas yang mirip dengan distribusi normal , hanya saja distribusi tersebut mempunyai “ekor” yang lebih berat daripada distribusi normal.
Dengan kata lain, lebih banyak nilai dalam distribusi yang terletak di ujung daripada di tengah dibandingkan dengan distribusi normal:
Tutorial ini menjelaskan cara menggunakan distribusi t dengan Python.
Cara menghasilkan untuk mendistribusikan
Anda dapat menggunakan fungsi t.rvs(df, size) untuk menghasilkan nilai acak dari distribusi dengan derajat kebebasan dan ukuran sampel tertentu:
from scipy. stats import t #generate random values from t distribution with df=6 and sample size=10 t. rvs (df= 6 , size= 10 ) array([-3.95799716, -0.01099963, -0.55953846, -1.53420055, -1.41775611, -0.45384974, -0.2767931, -0.40177789, -0.3602592, 0.38262431])
Hasilnya adalah tabel 10 nilai yang mengikuti satu sama lain menurut distribusi dengan 6 derajat kebebasan.
Cara menghitung nilai P menggunakan distribusi t
Kita dapat menggunakan fungsi t.cdf(x, df, loc=0, scale=1) untuk mencari nilai p yang terkait dengan statistik uji-t.
Contoh 1: Menemukan Nilai P Satu Sisi
Misalkan kita melakukan uji hipotesis satu sisi dan mendapatkan statistik uji -1,5 dan derajat kebebasan = 10 .
Kita dapat menggunakan sintaks berikut untuk menghitung nilai p yang sesuai dengan statistik pengujian ini:
from scipy. stats import t #calculate p-value t. cdf (x=-1.5, df=10) 0.08225366322272008
Nilai p satu sisi yang sesuai dengan statistik uji -1,5 dengan 10 derajat kebebasan adalah 0,0822 .
Contoh 2: Menemukan Nilai P Dua Arah
Misalkan kita melakukan uji hipotesis dua sisi dan mendapatkan statistik uji 2,14 dan derajat kebebasan = 20 .
Kita dapat menggunakan sintaks berikut untuk menghitung nilai p yang sesuai dengan statistik pengujian ini:
from scipy. stats import t #calculate p-value (1 - t. cdf (x=2.14, df=20)) * 2 0.04486555082549959
Nilai p dua sisi yang sesuai dengan statistik uji 2,14 dengan 20 derajat kebebasan adalah 0,0448 .
Catatan : Anda dapat memeriksa jawaban ini menggunakan kalkulator distribusi t terbalik.
Cara menelusuri hingga distribusinya
Anda dapat menggunakan sintaks berikut untuk memplot distribusi dengan derajat kebebasan tertentu:
from scipy. stats import t import matplotlib. pyplot as plt #generate t distribution with sample size 10000 x = t. rvs (df= 12 , size= 10000 ) #create plot of t distribution plt. hist (x, density= True , edgecolor=' black ', bins= 20 )
Alternatifnya, Anda dapat membuat kurva kepadatan menggunakan paket visualisasi seaborn :
import seaborn as sns #create density curve sns. kdeplot (x)
Sumber daya tambahan
Tutorial berikut memberikan informasi tambahan tentang distribusi:
Distribusi normal vs distribusi t: apa bedanya?
Kalkulator distribusi t terbalik