วิธีสร้างฮิสโตแกรมจาก pandas dataframe


คุณสามารถใช้ไวยากรณ์พื้นฐานต่อไปนี้เพื่อสร้างฮิสโตแกรมจาก DataFrame ของแพนด้า:

 df. hist (column=' col_name ')

ตัวอย่างต่อไปนี้แสดงวิธีใช้ไวยากรณ์นี้ในทางปฏิบัติ

ตัวอย่างที่ 1: พล็อตฮิสโตแกรมเดียว

รหัสต่อไปนี้แสดงวิธีการสร้างฮิสโตแกรมเดียวสำหรับคอลัมน์ใดคอลัมน์หนึ่งใน DataFrame ของแพนด้า:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29, 29, 31, 31, 33],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 7, 7, 8, 9],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 10, 7, 7, 9]})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6

#create histogram for 'points' column
df. hist (column=' points ')

เรายังปรับแต่งฮิสโตแกรมด้วยสี สไตล์ ป้ายกำกับ และจำนวนช่องที่เฉพาะเจาะจงได้:

 #create custom histogram for 'points' column
df. hist (column=' points ', bins= 5 , grid= False , rwidth= .9 , color=' purple ')

ฮิสโตแกรมแพนด้า

แกน x แสดงคะแนนต่อผู้เล่นหนึ่งคน และแกน y แสดงความถี่ของจำนวนผู้เล่นที่ทำคะแนนได้มากขนาดนั้น

ตัวอย่างที่ 2: การลงจุดหลายฮิสโตแกรม

รหัสต่อไปนี้แสดงวิธีการลงจุดหลายฮิสโตแกรมจาก Pandas DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ':['A', 'A', 'A', 'A', 'A', 'A',
                           'B', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29, 29, 31, 31, 33]})

#view first five rows
df. head ()

        team points
0 to 25
1 to 12
2 to 15
3 to 14
4 to 19

#create histogram for each team
df. hist (column=' points ', by=' team ', bins= 3 , grid= False , rwidth= .9 ,
        color=' purple ', sharex= True )

ฮิสโตแกรมหลายอันในแพนด้า

โปรดทราบว่าอาร์กิวเมนต์ sharex ระบุว่าฮิสโตแกรมทั้งสองต้องมีแกน x เดียวกัน

ทำให้ง่ายต่อการเปรียบเทียบการกระจายของค่าระหว่างฮิสโตแกรมทั้งสอง

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีสร้างแปลงทั่วไปอื่น ๆ ใน Python:

วิธีพล็อตหลายบรรทัดใน Matplotlib
วิธีสร้าง boxplot จาก Pandas DataFrame
วิธีลงจุดคอลัมน์ Pandas หลายคอลัมน์บนแผนภูมิแท่ง

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *