วิธีการคำนวณความน่าจะเป็นแบบมีเงื่อนไขใน python


ความน่าจะเป็นแบบมีเงื่อนไข ของเหตุการณ์ A ที่เกิดขึ้น เมื่อพิจารณาว่าเหตุการณ์ B เกิดขึ้น มีการคำนวณดังนี้

P(A|B) = P(A∩B) / P(B)

ทอง:

P(A∩B) = ความน่าจะเป็นที่เหตุการณ์ A และเหตุการณ์ B เกิดขึ้นทั้งคู่

P(B) = ความน่าจะเป็นที่เหตุการณ์ B จะเกิดขึ้น

ตัวอย่างต่อไปนี้แสดงวิธีใช้สูตรนี้เพื่อคำนวณความน่าจะเป็นแบบมีเงื่อนไขใน Python

ตัวอย่าง: คำนวณความน่าจะเป็นแบบมีเงื่อนไขใน Python

สมมติว่าเราส่งแบบสำรวจไปยังผู้คน 300 คนเพื่อถามว่าพวกเขาชอบกีฬาประเภทใด: เบสบอล บาสเก็ตบอล ฟุตบอล หรือฟุตบอล

เราสามารถสร้างตารางต่อไปนี้ใน Python เพื่อเก็บคำตอบแบบสำรวจ:

 import pandas as pd
import numpy as np

#create pandas DataFrame with raw data
df = pd. DataFrame ({' gender ': np. repeat (np. array (['Male', 'Female']), 150),
                   ' sport ': np. repeat (np. array (['Baseball', 'Basketball', 'Football',
                                                'Soccer', 'Baseball', 'Basketball',
                                                'Football', 'Soccer']), 
                                    (34, 40, 58, 18, 34, 52, 20, 44))})

#produce contingency table to summarize raw data
survey_data = pd. crosstab (index=df[' gender '], columns=df[' sport '], margins= True )

#view contingency table
survey_data

sport Baseball Basketball Football Soccer All
gender					
Female 34 52 20 44 150
Male 34 40 58 18 150
All 68 92 78 62 300

ที่เกี่ยวข้อง : วิธีใช้ pd.crosstab() เพื่อสร้างตารางฉุกเฉินใน Python

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อแยกค่าออกจากอาร์เรย์:

 #extract value in second row and first column 
survey_data. iloc [1, 0]

[1] 34

เราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อคำนวณความน่าจะเป็นที่บุคคลนั้นเป็นผู้ชาย โดยพิจารณาว่าเขาชอบเบสบอลเป็นกีฬาโปรด:

 #calculate probability of being male, given that individual prefers baseball
survey_data. iloc [1, 0]/survey_data. iloc [2, 0]

0.5

และเราสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อคำนวณความน่าจะเป็นที่แต่ละคนชอบบาสเก็ตบอลเป็นกีฬาโปรด โดยพิจารณาว่าเป็นผู้หญิง:

 #calculate probability of preferring basketball, given that individual is female
survey_data. iloc [0,1]/survey_data. iloc [0, 4]

0.3466666666666667

เราสามารถใช้แนวทางพื้นฐานนี้ในการคำนวณความน่าจะเป็นแบบมีเงื่อนไขที่เราต้องการจากตารางฉุกเฉิน

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้ให้ข้อมูลเพิ่มเติมเกี่ยวกับการจัดการความน่าจะเป็น:

กฎแห่งความน่าจะเป็นทั้งหมด
วิธีค้นหาค่าเฉลี่ยของการแจกแจงความน่าจะเป็น
วิธีค้นหาค่าเบี่ยงเบนมาตรฐานของการแจกแจงความน่าจะเป็น

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *