วิธีเลือกแถวเดี่ยวใน pandas dataframe


คุณสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อเลือกแถวเดียวใน DataFrame ของแพนด้า:

 df = df. drop_duplicates ()

และคุณสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อเลือกแถวเดี่ยวในคอลัมน์เฉพาะใน Pandas DataFrame:

 df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])

ตัวอย่างต่อไปนี้แสดงวิธีการใช้ไวยากรณ์นี้ในทางปฏิบัติกับ Pandas DataFrame ต่อไปนี้:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' a ':[4,4,3,8],
                   ' b ': [2, 2, 6, 8],
                   ' c ': [2, 2, 9, 9]})

#view DataFrame
df

	a b c
0 4 2 2
1 4 2 2
2 3 6 9
3 8 8 9

ตัวอย่างที่ 1: เลือกแถวที่ไม่ซ้ำกันในทุกคอลัมน์

รหัสต่อไปนี้แสดงวิธีการเลือกแถวที่ไม่ซ้ำในทุกคอลัมน์ของ Pandas DataFrame:

 #drop duplicates from DataFrame
df = df. drop_duplicates ()

#view DataFrame
df

	a b c
0 4 2 2
2 3 6 9
3 8 8 9

บรรทัดที่หนึ่งและสองซ้ำกัน ดังนั้นแพนด้าจึงละทิ้งบรรทัดที่สอง

ตามค่าเริ่มต้น ฟังก์ชัน drop_duplicates() จะเก็บสำเนาแรกไว้ อย่างไรก็ตาม คุณสามารถระบุให้เก็บสำเนาสุดท้ายไว้แทนได้:

 #drop duplicates from DataFrame, keep last duplicate
df = df. drop_duplicates (keep=' last ')

#view DataFrame
df

	a b c
1 4 2 2
2 3 6 9
3 8 8 9

ตัวอย่างที่ 2: เลือกแถวที่ไม่ซ้ำในคอลัมน์เฉพาะ

รหัสต่อไปนี้แสดงวิธีการเลือกแถวเดี่ยวในคอลัมน์ “c” เดี่ยวของ DataFrame:

 #drop duplicates from column 'c' in DataFrame
df = df. drop_duplicates (subset=[' c '])

#view DataFrame
df
	a b c
0 4 2 2
2 3 6 9

สองแถวถูกลบออกจาก DataFrame

แหล่งข้อมูลเพิ่มเติม

วิธีเลือกแถวตามดัชนีใน Pandas DataFrame
วิธีรับหมายเลขแถวใน Pandas DataFrame
วิธีค้นหาค่าที่ไม่ซ้ำในคอลัมน์ใน Pandas

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *