วิธีใช้ฟังก์ชัน droplevels ใน r (พร้อมตัวอย่าง)


ฟังก์ชัน droplevels() ใน R สามารถใช้เพื่อลบระดับแฟคเตอร์ที่ไม่ได้ใช้

ฟังก์ชันนี้มีประโยชน์อย่างยิ่งหากเราต้องการลบระดับแฟคเตอร์ที่ไม่ได้ใช้อีกต่อไปเนื่องจากเซตย่อยของเวกเตอร์หรือเฟรมข้อมูล

ฟังก์ชันนี้ใช้ไวยากรณ์ต่อไปนี้:

ระดับดรอป (x)

โดยที่ x เป็นวัตถุที่ใช้ลบระดับแฟคเตอร์ที่ไม่ได้ใช้

บทช่วยสอนนี้ให้ตัวอย่างวิธีใช้ฟีเจอร์นี้ในทางปฏิบัติ

ตัวอย่างที่ 1: ลบระดับปัจจัยที่ไม่ได้ใช้ในเวกเตอร์

สมมติว่าเราสร้างเวกเตอร์ข้อมูลที่มีระดับปัจจัยห้าระดับ ต่อไป สมมติว่าเรากำหนดเวกเตอร์ข้อมูลใหม่โดยมีเพียงสามระดับจากห้าระดับปัจจัยดั้งเดิม

 #define data with 5 factor levels
data <- factor (c(1, 2, 3, 4, 5))

#define new data as original data minus 4th and 5th factor levels
new_data <- data[-c(4, 5)]

#view new data
new_data

[1] 1 2 3
Levels: 1 2 3 4 5

แม้ว่าข้อมูลใหม่จะมีปัจจัยเพียง 3 ปัจจัยเท่านั้น แต่เราจะเห็นได้ว่ายังคงมีระดับปัจจัย 5 ระดับเดิมอยู่

หากต้องการลบระดับปัจจัยที่ไม่ได้ใช้เหล่านี้ เราสามารถใช้ฟังก์ชัน droplevels() ได้:

 #drop unused factor levels
new_data < -droplevels (new_data)

#view data
new_data

[1] 1 2 3
Levels: 1 2 3

ข้อมูลใหม่ขณะนี้มีเพียงสามระดับของปัจจัย

ตัวอย่างที่ 2: ลบระดับปัจจัยที่ไม่ได้ใช้ในกรอบข้อมูล

สมมติว่าเราสร้างกรอบข้อมูลที่ตัวแปรตัวใดตัวหนึ่งเป็นปัจจัยห้าระดับ ต่อไป สมมติว่าเรากำหนดกรอบข้อมูลใหม่ที่ลบระดับปัจจัยสองระดับเหล่านี้:

 #create data frame
df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')),
                 sales = c(13, 16, 22, 27, 34))

#view data frame
df

  regional sales
1 to 13
2 B 16
3 C 22
4 D 27
5 E 34

#define new data frame
new_df <- subset (df, sales < 25)

#view new data frame
new_df

  regional sales
1 to 13
2 B 16
3 C 22

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C” “D” “E”

แม้ว่าฐานข้อมูลใหม่จะมีเพียงสามปัจจัยในคอลัมน์ ภูมิภาค แต่ยังคงมีระดับปัจจัยห้าระดับเดิม สิ่งนี้จะสร้างปัญหาหากเราพยายามสร้างแปลงโดยใช้ข้อมูลนี้

หากต้องการลบระดับปัจจัยที่ไม่ได้ใช้ออกจาก ตัวแปรภูมิภาค เราสามารถใช้ฟังก์ชัน droplevels() ได้:

 #drop unused factor levels
new_df$region <- droplevels (new_df$region)

#check levels of region variable
levels (new_df$region)

[1] “A” “B” “C”

ตอนนี้ตัวแปร ภูมิภาค มีปัจจัยเพียงสามระดับเท่านั้น

คุณสามารถค้นหาบทช่วยสอน R เพิ่มเติมได้ใน หน้านี้

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *