วิธีเปลี่ยนจำนวนถังขยะที่ใช้ในฮิสโตแกรมของ pandas


คุณสามารถใช้อาร์กิวเมนต์ bins เพื่อเปลี่ยนจำนวนถังขยะที่ใช้ในฮิสโตแกรมแพนด้า:

 df. plot . hist (columns=[' my_column '], bins= 10 )

จำนวนถังขยะเริ่มต้นที่ใช้ในฮิสโตแกรมแพนด้าคือ 10

ตัวอย่างต่อไปนี้แสดงวิธีการใช้อาร์กิวเมนต์ bins ในทางปฏิบัติ

ตัวอย่าง: วิธีเปลี่ยนจำนวนถังขยะในฮิสโตแกรม Pandas

สมมติว่าเรามี DataFrame แพนด้าต่อไปนี้ซึ่งมีข้อมูลเกี่ยวกับคะแนนที่ผู้เล่นบาสเก็ตบอลจากทีมต่างๆ ทำไว้:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (1)

#createDataFrame
df = pd. DataFrame ({' team ': np.repeat ([' A ',' B ',' C '], 100 ),
                   ' points ': np. random . normal (loc= 20 , scale= 2 , size= 300 )})

#view head of DataFrame
print ( df.head ())

  team points
0 A 23.248691
1 A 18.776487
2 A 18.943656
3 A 17.854063
4 A 21.730815

หากเราสร้างฮิสโตแกรมเพื่อให้เห็นภาพการกระจายค่าของตัวแปร จุด โดยค่าเริ่มต้นแพนด้าจะใช้ 10 ถังขยะในฮิสโตแกรม:

 #create histogram to visualize distribution of points
df. plot . hist (column=[' points '], edgecolor=' black ')

โปรดสังเกตว่ามี 10 แท่งในฮิสโตแกรม

อย่างไรก็ตาม สมมติว่าเราใช้อาร์กิวเมนต์ bins เพื่อเปลี่ยนจำนวนถังขยะทั้งหมดเป็น 20:

 #create histogram with 20 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 20 ) 

แพนด้าเพิ่มจำนวนถังขยะในฮิสโตแกรม

โปรดสังเกตว่าขณะนี้มี 20 แท่งในฮิสโตแกรม

นอกจากนี้เรายังสามารถลดจำนวนถังขยะลงเหลือ 5:

 #create histogram with 5 bins
df. plot . hist (column=[' points '], edgecolor=' black ', bins= 5 ) 

แพนด้าลดจำนวนถังขยะในฮิสโตแกรม

ขณะนี้มีทั้งหมด 5 แท่งในฮิสโตแกรม

คุณสามารถปรับค่าของอาร์กิวเมนต์ bins เพื่อสร้างฮิสโตแกรมที่คุณต้องการได้

อย่างไรก็ตาม โปรดคำนึงถึงประเด็นต่อไปนี้เมื่อเลือกจำนวนถังขยะ:

  • หากคุณเลือกหมวดหมู่น้อยเกินไป ระบบสามารถซ่อนรูปแบบพื้นฐานของข้อมูลที่แท้จริงได้
  • หากคุณเลือกหมวดหมู่มากเกินไป คุณอาจเห็นเพียงจุดรบกวนในข้อมูลเท่านั้น

วิธีที่มีประโยชน์ในการกำหนดจำนวนถังขยะที่เหมาะสมที่สุดที่จะใช้ในฮิสโตแกรมคือการใช้ กฎของ Sturges

แหล่งข้อมูลเพิ่มเติม

บทช่วยสอนต่อไปนี้จะอธิบายวิธีการทำงานทั่วไปอื่นๆ ในแพนด้า:

วิธีสร้างฮิสโตแกรมจาก Pandas DataFrame
วิธีสร้างฮิสโตแกรมจากซีรีย์ Pandas
วิธีการพล็อตฮิสโตแกรมตามกลุ่มใน Pandas

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *