Pandas တွင် t-test များပြုလုပ်နည်း (ဥပမာ 3 ခု)


အောက်ပါဥပမာများသည် pandas DataFrame ကို အသုံးပြု၍ မတူညီသော t-test သုံးခုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-

  • အမှီအခိုကင်းသော နမူနာနှစ်ခု t-test
  • Welch ၏ နမူနာ t-test နှစ်ခု
  • တွဲထားသော နမူနာများ t-test

ဥပမာ 1- ပန်ဒါများတွင် အမှီအခိုကင်းသော နမူနာနှစ်ခု t-test

လူဦးရေနှစ်ခု၏နည်းလမ်းများသည် တူညီခြင်းရှိမရှိ ဆုံးဖြတ်ရန် သီးခြားနမူနာနှစ်ခု t-test ကို အသုံးပြုသည်။

ဥပမာအားဖြင့်၊ မတူညီသော လေ့လာမှုနည်းလမ်းနှစ်ခုသည် စာမေးပွဲများတွင် ပျမ်းမျှအဆင့်များ မတူညီနိုင်သည်ကို ပါမောက္ခတစ်ဦးက သိချင်သည်ဆိုပါစို့။

၎င်းကိုစမ်းသပ်ရန်၊ သူသည်နည်းလမ်း A ကိုအသုံးပြုရန်ကျောင်းသား ၁၀ ဦးနှင့်နည်းလမ်း B ကိုအသုံးပြုရန်ကျောင်းသား ၁၀ ဦးကိုစုဆောင်းခဲ့သည်။

အောက်ပါကုဒ်သည် ကျောင်းသားတစ်ဦးစီ၏ရမှတ်များကို ပန်ဒါဒေတာဘောင်တစ်ခုထဲသို့ မည်သို့ထည့်သွင်းရမည်ကို ပြသသည်၊ ထို့နောက် လွတ်လပ်သောနမူနာနှစ်ခု t-test ကိုလုပ်ဆောင်ရန် SciPy စာကြည့်တိုက်၏ ttest_ind() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ။

 import pandas as pd
from scipy. stats import ttest_ind

#create pandas DataFrame
df = pd. DataFrame ({'method': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                              'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'],
                   'score': [71, 72, 72, 75, 78, 81, 82, 83, 89, 91, 80, 81, 81,
                             84, 88, 88, 89, 90, 90, 91]})

#view first five rows of DataFrame
df. head ()

  method score
0 to 71
1 To 72
2 To 72
3 to 75
4 to 78

#define samples
group1 = df[df[' method ']==' A ']
group2 = df[df[' method ']==' B ']

#perform independent two sample t-test
ttest_ind(group1[' score '], group2[' score '])

Ttest_indResult(statistic=-2.6034304605397938, pvalue=0.017969284594810425)

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • t-စမ်းသပ်မှုစာရင်းအင်း- 2.6034
  • p-တန်ဖိုး- 0.0179

p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ t-test ၏ null hypothesis ကို ငြင်းပယ်ပြီး နည်းလမ်းနှစ်ခုသည် မတူညီသော ပျမ်းမျှစာမေးပွဲရမှတ်များဆီသို့ ဦးတည်ကြောင်းဖော်ပြရန် လုံလောက်သောအထောက်အထားရှိကြောင်း ကောက်ချက်ချပါသည်။

ဥပမာ 2- ပန်ဒါများတွင် Welch’s t-test

Welch ၏ t-test သည် အမှီ ခိုကင်းသော နမူနာနှစ်ခု t-test နှင့် ဆင်တူသည်

ယခင်နမူနာကဲ့သို့ အတိအကျတူညီသောဒေတာအစုံတွင် Welch ၏ t-test ကိုလုပ်ဆောင်ရန်၊ ကျွန်ုပ်တို့သည် အောက်ပါအတိုင်း ttest_ind () လုပ်ဆောင်ချက်တွင် equal_var=False သတ်မှတ်ရန်လိုအပ်သည်-

 import pandas as pd
from scipy. stats import ttest_ind

#create pandas DataFrame
df = pd. DataFrame ({'method': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                              'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'],
                   'score': [71, 72, 72, 75, 78, 81, 82, 83, 89, 91, 80, 81, 81,
                             84, 88, 88, 89, 90, 90, 91]})

#define samples
group1 = df[df[' method ']==' A ']
group2 = df[df[' method ']==' B ']

#perform Welch's t-test
ttest_ind(group1[' score '], group2[' score '], equal_var= False )

Ttest_indResult(statistic=-2.603430460539794, pvalue=0.02014688617423973)

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • t-စမ်းသပ်မှုစာရင်းအင်း- 2.6034
  • p-တန်ဖိုး- 0.0201

p-value သည် 0.05 ထက်နည်းသောကြောင့် Welch ၏ t-test ၏ null hypothesis ကို ငြင်းပယ်ပြီး နည်းလမ်းနှစ်ခုသည် မတူညီသော ပျမ်းမျှစာမေးပွဲရမှတ်များဆီသို့ ဦးတည်ကြောင်းဖော်ပြရန် လုံလောက်သောအထောက်အထားရှိကြောင်း ကောက်ချက်ချပါသည်။

ဥပမာ 3- Pandas တွင် တွဲထားသော နမူနာ t-test

နမူနာတစ်ခုစီရှိ ရှုမြင်မှုတစ်ခုစီတွင် အခြားနမူနာတစ်ခု၏ စူးစမ်းလေ့လာမှုတစ်ခုနှင့် ဆက်စပ်နိုင်သောကြောင့် လူဦးရေနည်းလမ်းနှစ်ခုသည် တူညီမှုရှိမရှိ ဆုံးဖြတ်ရန် တွဲထားသောနမူနာများကို t-test ကို အသုံးပြုသည်။

ဥပမာအားဖြင့်၊ မတူညီသော လေ့လာမှုနည်းလမ်းနှစ်ခုသည် စာမေးပွဲများတွင် ပျမ်းမျှအဆင့်များ မတူညီနိုင်သည်ကို ပါမောက္ခတစ်ဦးက သိချင်သည်ဆိုပါစို့။

၎င်းကိုစမ်းသပ်ရန်အတွက် Method A ကိုအသုံးပြုရန် ကျောင်းသား 10 ယောက်ကို စုဆောင်းပြီးနောက် စာမေးပွဲတစ်ခုဖြေဆိုပါ။ ထို့နောက် Method B အသုံးပြုသော ကျောင်းသား ၁၀ ဦးကို ပြင်ဆင်ပြီး အလားတူအခက်အခဲ၏ နောက်ထပ်စမ်းသပ်မှုကို ဖြေဆိုခွင့်ပေးသည်။

ကျောင်းသားအားလုံးနမူနာနှစ်ခုစလုံးတွင် ပေါ်လာသောကြောင့်၊ ဤအခြေအနေတွင် တွဲထားသောနမူနာ t-test ကို ကျွန်ုပ်တို့လုပ်ဆောင်နိုင်ပါသည်။

အောက်ပါကုဒ်သည် ကျောင်းသားတစ်ဦးစီ၏ရမှတ်များကို pandas DataFrame တွင် မည်သို့ထည့်သွင်းရမည်ကိုပြသထားပြီး၊ တွဲထားသောနမူနာများကို t-test ပြုလုပ်ရန် SciPy စာကြည့်တိုက်၏ ttest_rel() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ-

 import pandas as pd
from scipy. stats import ttest_rel

#create pandas DataFrame
df = pd. DataFrame ({'method': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                              'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'],
                   'score': [71, 72, 72, 75, 78, 81, 82, 83, 89, 91, 80, 81, 81,
                             84, 88, 88, 89, 90, 90, 91]})

#view first five rows of DataFrame
df. head ()

  method score
0 to 71
1 To 72
2 To 72
3 to 75
4 to 78

#define samples
group1 = df[df[' method ']==' A ']
group2 = df[df[' method ']==' B ']

#perform independent two sample t-test
ttest_rel(group1[' score '], group2[' score '])

Ttest_relResult(statistic=-6.162045351967805, pvalue=0.0001662872100210469)

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

  • t-စမ်းသပ်မှုစာရင်းအင်း- 6.1620
  • p-တန်ဖိုး- 0.0001

p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ တွဲထားသောနမူနာများ t-test ၏ null hypothesis ကို ငြင်းပယ်ပြီး နည်းလမ်းနှစ်ခုသည် မတူညီသော ပျမ်းမျှစာမေးပွဲရမှတ်များဆီသို့ ဦးတည်ကြောင်းဖော်ပြရန် လုံလောက်သောအထောက်အထားရှိကြောင်း ကောက်ချက်ချပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ပါ သင်ခန်းစာများသည် Python တွင် အခြားသော အသုံးများသော အလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Python တွင် Chi-Square လွတ်လပ်ရေးစမ်းသပ်မှုပြုလုပ်နည်း
Python တွင် One-Way ANOVA လုပ်ဆောင်နည်း
Python တွင် Fisher’s Exact Test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။

မှတ်ချက်တစ်ခုထည့်ပါ။

သင့် email လိပ်စာကို ဖော်ပြမည် မဟုတ်ပါ။ လိုအပ်သော ကွက်လပ်များကို * ဖြင့်မှတ်သားထားသည်