วิธีเพิ่มคอลัมน์ตัวเลขใน pandas dataframe


คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อเพิ่มคอลัมน์ “นับ” ลงใน DataFrame ของแพนด้า:

 df[' var1_count '] = df. groupby (' var1 ')[' var1 ']. transform (' count ')

ไวยากรณ์เฉพาะนี้จะเพิ่มคอลัมน์ชื่อ var1_count ให้กับ DataFrame ซึ่งมีจำนวนค่าในคอลัมน์ชื่อ var1

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่าง: เพิ่มคอลัมน์ตัวเลขใน Pandas

สมมติว่าเรามี DataFrame แพนด้าต่อไปนี้ซึ่งมีข้อมูลเกี่ยวกับผู้เล่นบาสเกตบอลต่างๆ:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' pos ': ['Gu', 'Fo', 'Fo', 'Fo', 'Gu', 'Gu', 'Fo', 'Fo'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28]})

#view DataFrame
print (df)

  team pos points
0 A Gu 18
1 A Fo 22
2 A Fo 19
3 B Fo 14
4 B Gu 14
5 B Gu 11
6 B Fo 20
7 B Fo 28

เราสามารถใช้โค้ดต่อไปนี้เพื่อเพิ่มคอลัมน์ชื่อ team_count ซึ่งประกอบด้วยจำนวนแต่ละทีม:

 #add column that shows total count of each team
df[' team_count '] = df. groupby (' team ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_count
0 A Gu 18 3
1 A Fo 22 3
2 A Fo 19 3
3 B Fo 14 5
4 B Gu 14 5
5 B Gu 11 5
6 B Fo 20 5
7 B Fo 28 5

มี 3 ไลน์ที่มีค่าทีมเป็น A และ 5 ไลน์ที่มีค่าทีมเป็น B

ดังนั้น:

  • สำหรับแต่ละแถวที่ team เท่ากับ A ค่าในคอลัมน์ team_count คือ 3
  • สำหรับแต่ละแถวที่ team เท่ากับ B ค่าในคอลัมน์ team_count คือ 5

คุณยังสามารถเพิ่มคอลัมน์ “บัญชี” ซึ่งจัดกลุ่มตัวแปรหลายตัวไว้ด้วยกันได้

ตัวอย่างเช่น รหัสต่อไปนี้แสดงวิธีการเพิ่มคอลัมน์ “นับ” ที่จัดกลุ่ม ทีม และตัวแปร POS :

 #add column that shows total count of each team and position
df[' team_pos_count '] = df. groupby ([' team ', ' pos ')[' team ']. transform (' count ')

#view updated DataFrame
print (df)

  team pos points team_pos_count
0 A Gu 18 1
1 A Fo 22 2
2 A Fo 19 2
3 B Fo 14 3
4 B Gu 14 2
5 B Gu 11 2
6 B Fo 20 3
7 B Fo 28 3

จากผลลัพธ์เราจะเห็นได้ว่า:

  • มี 1 แถวซึ่งประกอบด้วย A อยู่ในคอลัมน์ ทีม และ Gu อยู่ในคอลัมน์ pos
  • มี 2 แถวที่มี A ในคอลัมน์ ทีม และ Fo ในคอลัมน์ POS
  • มี 3 แถวซึ่งประกอบด้วย B อยู่ในคอลัมน์ ทีม และ Fo อยู่ในคอลัมน์ POS
  • มี 2 แถวที่มี B อยู่ในคอลัมน์ ทีม และ Gu อยู่ในคอลัมน์ POS

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:

Pandas: วิธีใช้ GroupBy และการนับค่า
Pandas: วิธีใช้ GroupBy พร้อมจำนวนถังขยะ
Pandas: วิธีนับค่าในคอลัมน์ที่มีเงื่อนไข

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *