วิธีใช้ฟังก์ชันอธิบาย () ในนุ่น (พร้อมตัวอย่าง)
คุณสามารถใช้ฟังก์ชัน อธิบาย() เพื่อสร้างสถิติเชิงพรรณนาสำหรับ DataFrame ของแพนด้า
ฟังก์ชันนี้ใช้ไวยากรณ์พื้นฐานต่อไปนี้:
df. describe ()
ตัวอย่างต่อไปนี้แสดงวิธีการใช้ไวยากรณ์นี้ในทางปฏิบัติกับ Pandas DataFrame ต่อไปนี้:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
' points ': [25, 12, 15, 14, 19, 23, 25, 29],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#view DataFrame
df
team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 B 19 12 6
5 C 23 9 5
6 C 25 9 9
7 C 29 4 12
ตัวอย่างที่ 1: อธิบายคอลัมน์ตัวเลขทั้งหมด
ตามค่าเริ่มต้น ฟังก์ชัน อธิบาย() จะสร้างเฉพาะสถิติเชิงพรรณนาสำหรับคอลัมน์ตัวเลขของ DataFrame ของแพนด้า:
#generate descriptive statistics for all numeric columns df. describe () points assists rebounds count 8.000000 8.00000 8.000000 mean 20.250000 7.75000 8.375000 std 6.158618 2.54951 2.559994 min 12.000000 4.00000 5.000000 25% 14.750000 6.50000 6.000000 50% 21.000000 8.00000 8.500000 75% 25,000000 9,00000 10,250000 max 29.000000 12.00000 12.000000
สถิติเชิงพรรณนาจะแสดงสำหรับคอลัมน์ตัวเลขสามคอลัมน์ของ DataFrame
หมายเหตุ: หากคอลัมน์ใดมีค่าหายไป แพนด้าจะยกเว้นค่าเหล่านี้โดยอัตโนมัติเมื่อคำนวณสถิติเชิงพรรณนา
ตัวอย่างที่ 2: อธิบายคอลัมน์ทั้งหมด
ในการคำนวณสถิติเชิงพรรณนาสำหรับแต่ละคอลัมน์ของ DataFrame เราสามารถใช้อาร์กิวเมนต์ include=’all’ ได้:
#generate descriptive statistics for all columns
df. describe (include=' all ')
team points assists rebounds
count 8 8.000000 8.00000 8.000000
single 3 NaN NaN NaN
top B NaN NaN NaN
freq 3 NaN NaN NaN
mean NaN 20.250000 7.75000 8.375000
std NaN 6.158618 2.54951 2.559994
min NaN 12.000000 4.00000 5.000000
25% NaN 14.750000 6.50000 6.000000
50% NaN 21.000000 8.00000 8.500000
75% NaN 25.000000 9.00000 10.250000
max NaN 29.000000 12.00000 12.000000
ตัวอย่างที่ 3: อธิบายคอลัมน์เฉพาะ
รหัสต่อไปนี้แสดงวิธีการคำนวณสถิติเชิงพรรณนาสำหรับคอลัมน์เฉพาะของ Pandas DataFrame:
#calculate descriptive statistics for 'points' column only
df[' points ']. describe ()
count 8.000000
mean 20.250000
std 6.158618
min 12.000000
25% 14.750000
50% 21,000000
75% 25,000000
max 29.000000
Name: points, dtype: float64
รหัสต่อไปนี้แสดงวิธีการคำนวณสถิติเชิงพรรณนาสำหรับคอลัมน์เฉพาะหลายคอลัมน์:
#calculate descriptive statistics for 'points' and 'assists' columns only
df[[' points ', ' assists ']]. describe ()
assist points
count 8.000000 8.00000
mean 20.250000 7.75000
std 6.158618 2.54951
min 12.000000 4.00000
25% 14.750000 6.50000
50% 21,000000 8,00000
75% 25.000000 9.00000
max 29.000000 12.00000
คุณสามารถดูเอกสารฉบับเต็มสำหรับฟังก์ชัน อธิบาย() ได้ที่นี่
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีการใช้งานฟังก์ชันทั่วไปอื่น ๆ ในแพนด้า:
Pandas: วิธีค้นหาค่าที่ไม่ซ้ำในคอลัมน์
นุ่น: วิธีค้นหาความแตกต่างระหว่างสองบรรทัด
Pandas: วิธีนับค่าที่หายไปใน DataFrame