Pandas: วิธีใช้ description() ตามกลุ่ม


คุณสามารถใช้ฟังก์ชัน อธิบาย() เพื่อสร้างสถิติเชิงพรรณนาสำหรับตัวแปรใน Pandas DataFrame

คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อใช้ฟังก์ชัน อธิบาย() กับฟังก์ชัน groupby() ในหมีแพนด้า:

 df. groupby (' group_var ')[' values_var ']. describe ()

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่าง: ใช้อธิบาย() โดยกลุ่มใน Pandas

สมมติว่าเรามี DataFrame แพนด้าต่อไปนี้ซึ่งมีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลจากสองทีมที่แตกต่างกัน:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [8, 12, 14, 14, 15, 22, 27, 24],
                   ' assists ':[2, 2, 3, 5, 7, 6, 8, 12]})

#view DataFrame
print (df)

  team points assists
0 to 8 2
1 to 12 2
2 to 14 3
3 to 14 5
4 B 15 7
5 B 22 6
6 B 27 8
7 B 24 12

เราสามารถใช้ฟังก์ชัน อธิบาย() ร่วมกับฟังก์ชัน groupby() เพื่อสรุปค่าในคอลัมน์ คะแนน ของแต่ละ ทีม ได้ :

 #summarize points by team
df. groupby (' team ')[' points ']. describe ()

count mean std min 25% 50% 75% max
team								
A 4.0 12.0 2.828427 8.0 11.00 13.0 14.00 14.0
B 4.0 22.0 5.099020 15.0 20.25 23.0 24.75 27.0

จากผลลัพธ์เราจะเห็นค่าตัวแปร คะแนน ของแต่ละทีมดังต่อไปนี้:

  • นับ (จำนวนการสังเกต)
  • เฉลี่ย (มูลค่าคะแนนเฉลี่ย)
  • std (ส่วนเบี่ยงเบนมาตรฐานของค่าจุด)
  • ขั้นต่ำ (ค่าคะแนนขั้นต่ำ)
  • 25 % (เปอร์เซ็นไทล์ที่ 25 ของคะแนน)
  • 50 % (เปอร์เซ็นไทล์ที่ 50 (เช่น ค่ามัธยฐาน) ของคะแนน)
  • 75 % (เปอร์เซ็นไทล์ที่ 75 ของคะแนน)
  • สูงสุด (ค่าคะแนนสูงสุด)

หากคุณต้องการให้ผลลัพธ์แสดงในรูปแบบ DataFrame คุณสามารถใช้อาร์กิวเมนต์ reset_index() ได้:

 #summarize points by team
df. groupby (' team ')[' points ']. describe (). reset_index ()

        team count mean std min 25% 50% 75% max
0 A 4.0 12.0 2.828427 8.0 11.00 13.0 14.00 14.0
1 B 4.0 22.0 5.099020 15.0 20.25 23.0 24.75 27.0

ตอนนี้ตัวแปร ทีม กลายเป็นคอลัมน์ใน DataFrame และค่าดัชนีเป็น 0 และ 1

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีดำเนินการทั่วไปอื่น ๆ ในแพนด้า:

นุ่น: วิธีคำนวณผลรวมสะสมต่อกลุ่ม
Pandas: วิธีนับค่าที่ไม่ซ้ำตามกลุ่ม
นุ่น: วิธีคำนวณความสัมพันธ์ตามกลุ่ม

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *