วิธีเลือกแถวเดี่ยวใน pandas dataframe
คุณสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อเลือกแถวเดียวใน DataFrame ของแพนด้า:
df = df. drop_duplicates ()
และคุณสามารถใช้ไวยากรณ์ต่อไปนี้เพื่อเลือกแถวเดี่ยวในคอลัมน์เฉพาะใน Pandas DataFrame:
df = df. drop_duplicates (subset=[' col1 ', ' col2 ', ...])
ตัวอย่างต่อไปนี้แสดงวิธีการใช้ไวยากรณ์นี้ในทางปฏิบัติกับ Pandas DataFrame ต่อไปนี้:
import pandas as pd #createDataFrame df = pd. DataFrame ({' a ':[4,4,3,8], ' b ': [2, 2, 6, 8], ' c ': [2, 2, 9, 9]}) #view DataFrame df a b c 0 4 2 2 1 4 2 2 2 3 6 9 3 8 8 9
ตัวอย่างที่ 1: เลือกแถวที่ไม่ซ้ำกันในทุกคอลัมน์
รหัสต่อไปนี้แสดงวิธีการเลือกแถวที่ไม่ซ้ำในทุกคอลัมน์ของ Pandas DataFrame:
#drop duplicates from DataFrame df = df. drop_duplicates () #view DataFrame df a b c 0 4 2 2 2 3 6 9 3 8 8 9
บรรทัดที่หนึ่งและสองซ้ำกัน ดังนั้นแพนด้าจึงละทิ้งบรรทัดที่สอง
ตามค่าเริ่มต้น ฟังก์ชัน drop_duplicates() จะเก็บสำเนาแรกไว้ อย่างไรก็ตาม คุณสามารถระบุให้เก็บสำเนาสุดท้ายไว้แทนได้:
#drop duplicates from DataFrame, keep last duplicate df = df. drop_duplicates (keep=' last ') #view DataFrame df a b c 1 4 2 2 2 3 6 9 3 8 8 9
ตัวอย่างที่ 2: เลือกแถวที่ไม่ซ้ำในคอลัมน์เฉพาะ
รหัสต่อไปนี้แสดงวิธีการเลือกแถวเดี่ยวในคอลัมน์ “c” เดี่ยวของ DataFrame:
#drop duplicates from column 'c' in DataFrame df = df. drop_duplicates (subset=[' c ']) #view DataFrame df a b c 0 4 2 2 2 3 6 9
สองแถวถูกลบออกจาก DataFrame
แหล่งข้อมูลเพิ่มเติม
วิธีเลือกแถวตามดัชนีใน Pandas DataFrame
วิธีรับหมายเลขแถวใน Pandas DataFrame
วิธีค้นหาค่าที่ไม่ซ้ำในคอลัมน์ใน Pandas