ပန်ဒါများတွင် အချိုးကျနမူနာ (ဥပမာများနှင့်အတူ)
သုတေသီများသည် လူဦးရေတစ်ရပ်လုံးမှ နမူနာများကို မကြာခဏယူ၍ လူဦးရေတစ်ခုလုံးနှင့်ပတ်သက်သော ကောက်ချက်ဆွဲရန် နမူနာမှဒေတာကို အသုံးပြုကြသည်။
အသုံးများသောနမူနာနည်းလမ်းမှာ stratified ကျပန်းနမူနာ ဖြစ်ပြီး၊ ယင်းတွင် လူဦးရေကို အုပ်စုများခွဲကာ အုပ်စုတစ်ခုစီမှ အဖွဲ့ဝင်အရေအတွက်အချို့ကို နမူနာတွင်ထည့်သွင်းရန်အတွက် ကျပန်းရွေးချယ်ထားသည်။
ဤသင်ခန်းစာသည် Python တွင် အစီအစဥ်ကျပန်းနမူနာလုပ်ဆောင်ခြင်းအတွက် နည်းလမ်းနှစ်ခုကို ရှင်းပြထားသည်။
ဥပမာ 1- ရေတွက်မှုကို အသုံးပြု၍ အချိုးကျနမူနာပြခြင်း။
ကျွန်ုပ်တို့တွင် မတူညီသောအသင်း 2 ခုမှ ဘတ်စကက်ဘောကစားသမား 8 ဦးတွင် ဒေတာပါရှိသော အောက်ပါပန်ဒါ DataFrame ရှိသည်ဆိုပါစို့။
import pandas as pd #createDataFrame df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], 'position': ['G', 'G', 'F', 'G', 'F', 'F', 'C', 'C'], 'assists': [5, 7, 7, 8, 5, 7, 6, 9], 'rebounds': [11, 8, 10, 6, 6, 9, 6, 10]}) #view DataFrame df team position assists rebounds 0 A G 5 11 1 A G 7 8 2 A F 7 10 3 A G 8 6 4 B F 5 6 5 B F 7 9 6 B C 6 6 7 B C 9 10
နမူနာတွင် ပါဝင်ရန် အဖွဲ့တစ်ခုစီမှ ကစားသမား 2 ဦးကို ကျပန်းရွေးချယ်ခြင်းဖြင့် အောက်ဖော်ပြပါ ကုဒ်သည် အစီအစဥ်ကျပန်းနမူနာကို မည်သို့လုပ်ဆောင်ရမည်ကို ပြသသည်-
df. groupby ('team', group_keys= False ). apply ( lambda x: x.sample (2)) team position assists rebounds 0 A G 5 11 3 A G 8 6 6 B C 6 6 5 B F 7 9
အသင်းတစ်သင်းစီမှ ကစားသမားနှစ်ဦးကို အစီအစဥ်ပုံစံတွင် ထည့်သွင်းထားကြောင်း သတိပြုပါ။
ဥပမာ 2- အချိုးများကို အသုံးပြု၍ အချိုးကျနမူနာပြခြင်း။
ကျွန်ုပ်တို့တွင် မတူညီသောအသင်း 2 ခုမှ ဘတ်စကက်ဘောကစားသမား 8 ဦးတွင် ဒေတာပါရှိသော အောက်ပါပန်ဒါ DataFrame ရှိသည် ဟု ထပ်မံယူဆကြပါစို့။
import pandas as pd #createDataFrame df = pd.DataFrame({'team': ['A', 'A', 'B', 'B', 'B', 'B', 'B', 'B'], 'position': ['G', 'G', 'F', 'G', 'F', 'F', 'C', 'C'], 'assists': [5, 7, 7, 8, 5, 7, 6, 9], 'rebounds': [11, 8, 10, 6, 6, 9, 6, 10]}) #view DataFrame df team position assists rebounds 0 A G 5 11 1 A G 7 8 2 A F 7 10 3 A G 8 6 4 B F 5 6 5 B F 7 9 6 B C 6 6 7 B C 9 10
DataFrame ရှိ ကစားသမား 8 ယောက်မှ 6 ယောက် (75%) သည် Team A တွင်ရှိပြီး ကစားသမား 8 ယောက်တွင် 2 ယောက် (25%) သည် Team B တွင် ရှိနေသည်ကို သတိပြုပါ။
အဖွဲ့တစ်ခုစီမှ ကစားသမားများ၏နမူနာမှ ကစားသမားအချိုးအစားသည် ပိုမိုကြီးမားသော DataFrame အတွင်းရှိ အသင်းတစ်ခုစီမှ ကစားသမားအချိုးအစားနှင့် ကိုက်ညီကြောင်း အောက်ပါကုဒ်တွင် ဖော်ပြထားပါသည်။
import numpy as np #define total sample size desired N = 4 #perform stratified random sampling df. groupby ('team', group_keys= False ). apply ( lambda x: x. sample (int(np. rint (N* len (x)/ len (df))))). sample (frac=1). reset_index (drop= True ) team position assists rebounds 0 B F 7 9 1 B G 8 6 2 B C 6 6 3 A G 7 8
အချိုးကျနမူနာရှိ Team A ကစားသမားများ၏ အချိုးအစား (25%) သည် ပိုမိုကြီးမားသော DataFrame ရှိ Team A ကစားသမားများ၏ အချိုးအစားနှင့် ကိုက်ညီကြောင်း သတိပြုပါ။
အလားတူ၊ အစီအစဥ်နမူနာရှိ Team B ကစားသမားများ၏ အချိုးအစား (75%) သည် ပိုမိုကြီးမားသော DataFrame ရှိ Team B ကစားသမားများ၏ အချိုးအစားနှင့် ကိုက်ညီပါသည်။
ထပ်လောင်းအရင်းအမြစ်များ
အောက်ဖော်ပြပါ သင်ခန်းစာများတွင် ပန်ဒါများကို အသုံးပြု၍ အခြားနမူနာအမျိုးအစားများကို ရွေးချယ်နည်းကို ရှင်းပြထားပါသည်။
Pandas တွင်အစုလိုက်နမူနာပြုလုပ်နည်း
ပန်ဒါများကြားတွင် စနစ်တကျနမူနာယူနည်း