Pandas တွင် t-test များပြုလုပ်နည်း (ဥပမာ 3 ခု)

အားဖြင့် Benjamin Anderson ဇူလိုင် 19, 2023 လမ်းညွှန် 0 မှတ်ချက်များ

အောက်ပါဥပမာများသည် pandas DataFrame ကို အသုံးပြု၍ မတူညီသော t-test သုံးခုကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-

အမှီအခိုကင်းသော နမူနာနှစ်ခု t-test
Welch ၏ နမူနာ t-test နှစ်ခု
တွဲထားသော နမူနာများ t-test

ဥပမာ 1- ပန်ဒါများတွင် အမှီအခိုကင်းသော နမူနာနှစ်ခု t-test

လူဦးရေနှစ်ခု၏နည်းလမ်းများသည် တူညီခြင်းရှိမရှိ ဆုံးဖြတ်ရန် သီးခြားနမူနာနှစ်ခု t-test ကို အသုံးပြုသည်။

ဥပမာအားဖြင့်၊ မတူညီသော လေ့လာမှုနည်းလမ်းနှစ်ခုသည် စာမေးပွဲများတွင် ပျမ်းမျှအဆင့်များ မတူညီနိုင်သည်ကို ပါမောက္ခတစ်ဦးက သိချင်သည်ဆိုပါစို့။

၎င်းကိုစမ်းသပ်ရန်၊ သူသည်နည်းလမ်း A ကိုအသုံးပြုရန်ကျောင်းသား ၁၀ ဦးနှင့်နည်းလမ်း B ကိုအသုံးပြုရန်ကျောင်းသား ၁၀ ဦးကိုစုဆောင်းခဲ့သည်။

အောက်ပါကုဒ်သည် ကျောင်းသားတစ်ဦးစီ၏ရမှတ်များကို ပန်ဒါဒေတာဘောင်တစ်ခုထဲသို့ မည်သို့ထည့်သွင်းရမည်ကို ပြသသည်၊ ထို့နောက် လွတ်လပ်သောနမူနာနှစ်ခု t-test ကိုလုပ်ဆောင်ရန် SciPy စာကြည့်တိုက်၏ ttest_ind() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ။

 import pandas as pd
from scipy. stats import ttest_ind

#create pandas DataFrame
df = pd. DataFrame ({'method': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                              'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'],
                   'score': [71, 72, 72, 75, 78, 81, 82, 83, 89, 91, 80, 81, 81,
                             84, 88, 88, 89, 90, 90, 91]})

#view first five rows of DataFrame
df. head ()

  method score
0 to 71
1 To 72
2 To 72
3 to 75
4 to 78

#define samples
group1 = df[df[' method ']==' A ']
group2 = df[df[' method ']==' B ']

#perform independent two sample t-test
ttest_ind(group1[' score '], group2[' score '])

Ttest_indResult(statistic=-2.6034304605397938, pvalue=0.017969284594810425)

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

t-စမ်းသပ်မှုစာရင်းအင်း- 2.6034
p-တန်ဖိုး- 0.0179

p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ t-test ၏ null hypothesis ကို ငြင်းပယ်ပြီး နည်းလမ်းနှစ်ခုသည် မတူညီသော ပျမ်းမျှစာမေးပွဲရမှတ်များဆီသို့ ဦးတည်ကြောင်းဖော်ပြရန် လုံလောက်သောအထောက်အထားရှိကြောင်း ကောက်ချက်ချပါသည်။

ဥပမာ 2- ပန်ဒါများတွင် Welch’s t-test

Welch ၏ t-test သည် အမှီ အ ခိုကင်းသော နမူနာနှစ်ခု t-test နှင့် ဆင်တူသည်

ယခင်နမူနာကဲ့သို့ အတိအကျတူညီသောဒေတာအစုံတွင် Welch ၏ t-test ကိုလုပ်ဆောင်ရန်၊ ကျွန်ုပ်တို့သည် အောက်ပါအတိုင်း ttest_ind () လုပ်ဆောင်ချက်တွင် equal_var=False သတ်မှတ်ရန်လိုအပ်သည်-

 import pandas as pd
from scipy. stats import ttest_ind

#create pandas DataFrame
df = pd. DataFrame ({'method': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                              'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'],
                   'score': [71, 72, 72, 75, 78, 81, 82, 83, 89, 91, 80, 81, 81,
                             84, 88, 88, 89, 90, 90, 91]})

#define samples
group1 = df[df[' method ']==' A ']
group2 = df[df[' method ']==' B ']

#perform Welch's t-test
ttest_ind(group1[' score '], group2[' score '], equal_var= False )

Ttest_indResult(statistic=-2.603430460539794, pvalue=0.02014688617423973)

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

t-စမ်းသပ်မှုစာရင်းအင်း- 2.6034
p-တန်ဖိုး- 0.0201

p-value သည် 0.05 ထက်နည်းသောကြောင့် Welch ၏ t-test ၏ null hypothesis ကို ငြင်းပယ်ပြီး နည်းလမ်းနှစ်ခုသည် မတူညီသော ပျမ်းမျှစာမေးပွဲရမှတ်များဆီသို့ ဦးတည်ကြောင်းဖော်ပြရန် လုံလောက်သောအထောက်အထားရှိကြောင်း ကောက်ချက်ချပါသည်။

ဥပမာ 3- Pandas တွင် တွဲထားသော နမူနာ t-test

နမူနာတစ်ခုစီရှိ ရှုမြင်မှုတစ်ခုစီတွင် အခြားနမူနာတစ်ခု၏ စူးစမ်းလေ့လာမှုတစ်ခုနှင့် ဆက်စပ်နိုင်သောကြောင့် လူဦးရေနည်းလမ်းနှစ်ခုသည် တူညီမှုရှိမရှိ ဆုံးဖြတ်ရန် တွဲထားသောနမူနာများကို t-test ကို အသုံးပြုသည်။

၎င်းကိုစမ်းသပ်ရန်အတွက် Method A ကိုအသုံးပြုရန် ကျောင်းသား 10 ယောက်ကို စုဆောင်းပြီးနောက် စာမေးပွဲတစ်ခုဖြေဆိုပါ။ ထို့နောက် Method B အသုံးပြုသော ကျောင်းသား ၁၀ ဦးကို ပြင်ဆင်ပြီး အလားတူအခက်အခဲ၏ နောက်ထပ်စမ်းသပ်မှုကို ဖြေဆိုခွင့်ပေးသည်။

ကျောင်းသားအားလုံးနမူနာနှစ်ခုစလုံးတွင် ပေါ်လာသောကြောင့်၊ ဤအခြေအနေတွင် တွဲထားသောနမူနာ t-test ကို ကျွန်ုပ်တို့လုပ်ဆောင်နိုင်ပါသည်။

အောက်ပါကုဒ်သည် ကျောင်းသားတစ်ဦးစီ၏ရမှတ်များကို pandas DataFrame တွင် မည်သို့ထည့်သွင်းရမည်ကိုပြသထားပြီး၊ တွဲထားသောနမူနာများကို t-test ပြုလုပ်ရန် SciPy စာကြည့်တိုက်၏ ttest_rel() လုပ်ဆောင်ချက်ကို အသုံးပြုပါ-

 import pandas as pd
from scipy. stats import ttest_rel

#create pandas DataFrame
df = pd. DataFrame ({'method': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                              'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'],
                   'score': [71, 72, 72, 75, 78, 81, 82, 83, 89, 91, 80, 81, 81,
                             84, 88, 88, 89, 90, 90, 91]})

#view first five rows of DataFrame
df. head ()

  method score
0 to 71
1 To 72
2 To 72
3 to 75
4 to 78

#define samples
group1 = df[df[' method ']==' A ']
group2 = df[df[' method ']==' B ']

#perform independent two sample t-test
ttest_rel(group1[' score '], group2[' score '])

Ttest_relResult(statistic=-6.162045351967805, pvalue=0.0001662872100210469)

ရလဒ်မှ ကျွန်ုပ်တို့ မြင်နိုင်သည်-

t-စမ်းသပ်မှုစာရင်းအင်း- 6.1620
p-တန်ဖိုး- 0.0001

p-value သည် 0.05 ထက်နည်းသောကြောင့်၊ တွဲထားသောနမူနာများ t-test ၏ null hypothesis ကို ငြင်းပယ်ပြီး နည်းလမ်းနှစ်ခုသည် မတူညီသော ပျမ်းမျှစာမေးပွဲရမှတ်များဆီသို့ ဦးတည်ကြောင်းဖော်ပြရန် လုံလောက်သောအထောက်အထားရှိကြောင်း ကောက်ချက်ချပါသည်။

ထပ်လောင်းအရင်းအမြစ်များ

အောက်ပါ သင်ခန်းစာများသည် Python တွင် အခြားသော အသုံးများသော အလုပ်များကို မည်သို့လုပ်ဆောင်ရမည်ကို ရှင်းပြသည်-

Python တွင် Chi-Square လွတ်လပ်ရေးစမ်းသပ်မှုပြုလုပ်နည်း
Python တွင် One-Way ANOVA လုပ်ဆောင်နည်း
Python တွင် Fisher’s Exact Test ကို မည်သို့လုပ်ဆောင်ရမည်နည်း။

စာရေးသူအကြောင်း

Benjamin Anderson

မင်္ဂလာပါ၊ ကျွန်ုပ်သည် အငြိမ်းစား စာရင်းအင်း ပါမောက္ခ ဘင်ဂျမင်ဖြစ်ပြီး သီးသန့် Statorials ဆရာအဖြစ် လှည့်ပတ်ပါသည်။ စာရင်းဇယားနယ်ပယ်တွင် ကျယ်ပြန့်သောအတွေ့အကြုံနှင့် ကျွမ်းကျင်မှုနှင့်အတူ၊ Statorials မှတစ်ဆင့် ကျောင်းသားများကို ခွန်အားဖြစ်စေရန်အတွက် ကျွန်ုပ်၏အသိပညာကို မျှဝေလိုပါသည်။ ပိုသိတယ်။

ဥပမာ 1- ပန်ဒါများတွင် အမှီအခိုကင်းသော နမူနာနှစ်ခု t-test

ဥပမာ 2- ပန်ဒါများတွင် Welch’s t-test

ဥပမာ 3- Pandas တွင် တွဲထားသော နမူနာ t-test

ထပ်လောင်းအရင်းအမြစ်များ

စာရေးသူအကြောင်း

Benjamin Anderson

မှတ်ချက်တစ်ခုထည့်ပါ။