วิธีคำนวณควอไทล์ในแพนด้า (พร้อมตัวอย่าง)
ในทางสถิติ ควอไทล์ คือค่าที่แบ่งชุดข้อมูลออกเป็นสี่ส่วนเท่าๆ กัน
เมื่อวิเคราะห์การกระจายตัว โดยทั่วไปเราจะสนใจควอไทล์ต่อไปนี้:
- ควอไทล์ที่หนึ่ง ( Q1 ): ค่าอยู่ที่เปอร์เซ็นไทล์ที่ 25
- ควอไทล์ที่สอง ( Q2 ): ค่าอยู่ที่เปอร์เซ็นไทล์ที่ 50
- ควอไทล์ที่สาม ( Q3 ): ค่าอยู่ที่เปอร์เซ็นไทล์ที่ 75
คุณสามารถใช้วิธีการต่อไปนี้เพื่อคำนวณควอไทล์ของคอลัมน์ใน Pandas DataFrame:
วิธีที่ 1: คำนวณควอไทล์สำหรับคอลัมน์
df[' some_column ']. quantile ([ 0.25 , 0.5 , 0.75 ])
วิธีที่ 2: คำนวณควอร์ไทล์สำหรับแต่ละคอลัมน์ตัวเลข
df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )
ตัวอย่างต่อไปนี้แสดงวิธีการใช้แต่ละวิธีในทางปฏิบัติกับ Pandas DataFrame ต่อไปนี้:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
' points ': [12, 14, 14, 16, 24, 26, 28, 30, 31, 35],
' assists ': [2, 2, 3, 3, 4, 6, 7, 8, 10, 15]})
#view DataFrame
print (df)
team points assists
0 to 12 2
1 B 14 2
2 C 14 3
3 D 16 3
4 E 24 4
5 F 26 6
6 G 28 7
7:30 8
8 I 31 10
9 D 35 15
ตัวอย่างที่ 1: คำนวณควอไทล์สำหรับคอลัมน์
รหัสต่อไปนี้แสดงวิธีการคำนวณควอร์ไทล์สำหรับคอลัมน์ จุด เท่านั้น:
#calculate quartiles for points column
df[' points ']. quantile ([ 0.25 , 0.5 , 0.75 ])
0.25 14.5
0.50 25.0
0.75 29.5
Name: points, dtype: float64
จากผลลัพธ์เราจะเห็นได้ว่า:
- ควอไทล์แรกคือ 14.5
- ควอไทล์ที่สองคือ 25
- ควอร์ไทล์ที่สามคือ 29.5
เมื่อทราบเพียงค่าทั้งสามนี้ เราก็มีความคิดที่ดีว่าค่าต่างๆ จะกระจายอยู่ในคอลัมน์ คะแนน อย่างไร
ตัวอย่างที่ 2: คำนวณควอร์ไทล์สำหรับแต่ละคอลัมน์ตัวเลข
รหัสต่อไปนี้แสดงวิธีการคำนวณควอร์ไทล์สำหรับแต่ละคอลัมน์ตัวเลขใน DataFrame:
#calculate quartiles for each numeric column in DataFrame
df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )
assist points
0.25 14.5 3.00
0.50 25.0 5.00
0.75 29.5 7.75
ผลลัพธ์จะแสดงควอร์ไทล์ของคอลัมน์ตัวเลข 2 คอลัมน์ของ DataFrame
โปรดทราบว่ามีหลายวิธีในการคำนวณควอร์ไทล์ของการแจกแจง
โปรดดู หน้าเอกสาร ของ Pandas เพื่อดูวิธีการต่างๆ ที่ฟังก์ชัน Pandas quantile() ใช้ในการคำนวณควอไทล์
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:
วิธีคำนวณเปอร์เซ็นต์การเปลี่ยนแปลงของแพนด้า
วิธีคำนวณเปอร์เซ็นต์สะสมในหมีแพนด้า
วิธีคำนวณเปอร์เซ็นต์ของผลรวมภายในกลุ่มเป็นแพนด้า