วิธีคำนวณควอไทล์ในแพนด้า (พร้อมตัวอย่าง)


ในทางสถิติ ควอไทล์ คือค่าที่แบ่งชุดข้อมูลออกเป็นสี่ส่วนเท่าๆ กัน

เมื่อวิเคราะห์การกระจายตัว โดยทั่วไปเราจะสนใจควอไทล์ต่อไปนี้:

  • ควอไทล์ที่หนึ่ง ( Q1 ): ค่าอยู่ที่เปอร์เซ็นไทล์ที่ 25
  • ควอไทล์ที่สอง ( Q2 ): ค่าอยู่ที่เปอร์เซ็นไทล์ที่ 50
  • ควอไทล์ที่สาม ( Q3 ): ค่าอยู่ที่เปอร์เซ็นไทล์ที่ 75

คุณสามารถใช้วิธีการต่อไปนี้เพื่อคำนวณควอไทล์ของคอลัมน์ใน Pandas DataFrame:

วิธีที่ 1: คำนวณควอไทล์สำหรับคอลัมน์

 df[' some_column ']. quantile ([ 0.25 , 0.5 , 0.75 ])

วิธีที่ 2: คำนวณควอร์ไทล์สำหรับแต่ละคอลัมน์ตัวเลข

 df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

ตัวอย่างต่อไปนี้แสดงวิธีการใช้แต่ละวิธีในทางปฏิบัติกับ Pandas DataFrame ต่อไปนี้:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'],
                   ' points ': [12, 14, 14, 16, 24, 26, 28, 30, 31, 35],
                   ' assists ': [2, 2, 3, 3, 4, 6, 7, 8, 10, 15]})

#view DataFrame
print (df)

  team points assists
0 to 12 2
1 B 14 2
2 C 14 3
3 D 16 3
4 E 24 4
5 F 26 6
6 G 28 7
7:30 8
8 I 31 10
9 D 35 15

ตัวอย่างที่ 1: คำนวณควอไทล์สำหรับคอลัมน์

รหัสต่อไปนี้แสดงวิธีการคำนวณควอร์ไทล์สำหรับคอลัมน์ จุด เท่านั้น:

 #calculate quartiles for points column
df[' points ']. quantile ([ 0.25 , 0.5 , 0.75 ])

0.25 14.5
0.50 25.0
0.75 29.5
Name: points, dtype: float64

จากผลลัพธ์เราจะเห็นได้ว่า:

  • ควอไทล์แรกคือ 14.5
  • ควอไทล์ที่สองคือ 25
  • ควอร์ไทล์ที่สามคือ 29.5

เมื่อทราบเพียงค่าทั้งสามนี้ เราก็มีความคิดที่ดีว่าค่าต่างๆ จะกระจายอยู่ในคอลัมน์ คะแนน อย่างไร

ตัวอย่างที่ 2: คำนวณควอร์ไทล์สำหรับแต่ละคอลัมน์ตัวเลข

รหัสต่อไปนี้แสดงวิธีการคำนวณควอร์ไทล์สำหรับแต่ละคอลัมน์ตัวเลขใน DataFrame:

 #calculate quartiles for each numeric column in DataFrame
df. quantile (q=[ 0.25 , 0.5 , 0.75 ], axis= 0 , numeric_only= True )

      assist points
0.25 14.5 3.00
0.50 25.0 5.00
0.75 29.5 7.75

ผลลัพธ์จะแสดงควอร์ไทล์ของคอลัมน์ตัวเลข 2 คอลัมน์ของ DataFrame

โปรดทราบว่ามีหลายวิธีในการคำนวณควอร์ไทล์ของการแจกแจง

โปรดดู หน้าเอกสาร ของ Pandas เพื่อดูวิธีการต่างๆ ที่ฟังก์ชัน Pandas quantile() ใช้ในการคำนวณควอไทล์

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:

วิธีคำนวณเปอร์เซ็นต์การเปลี่ยนแปลงของแพนด้า
วิธีคำนวณเปอร์เซ็นต์สะสมในหมีแพนด้า
วิธีคำนวณเปอร์เซ็นต์ของผลรวมภายในกลุ่มเป็นแพนด้า

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *