วิธีใช้ฟังก์ชัน droplevels ใน r (พร้อมตัวอย่าง)
ฟังก์ชัน droplevels() ใน R สามารถใช้เพื่อลบระดับแฟคเตอร์ที่ไม่ได้ใช้
ฟังก์ชันนี้มีประโยชน์อย่างยิ่งหากเราต้องการลบระดับแฟคเตอร์ที่ไม่ได้ใช้อีกต่อไปเนื่องจากเซตย่อยของเวกเตอร์หรือเฟรมข้อมูล
ฟังก์ชันนี้ใช้ไวยากรณ์ต่อไปนี้:
ระดับดรอป (x)
โดยที่ x เป็นวัตถุที่ใช้ลบระดับแฟคเตอร์ที่ไม่ได้ใช้
บทช่วยสอนนี้ให้ตัวอย่างวิธีใช้ฟีเจอร์นี้ในทางปฏิบัติ
ตัวอย่างที่ 1: ลบระดับปัจจัยที่ไม่ได้ใช้ในเวกเตอร์
สมมติว่าเราสร้างเวกเตอร์ข้อมูลที่มีระดับปัจจัยห้าระดับ ต่อไป สมมติว่าเรากำหนดเวกเตอร์ข้อมูลใหม่โดยมีเพียงสามระดับจากห้าระดับปัจจัยดั้งเดิม
#define data with 5 factor levels data <- factor (c(1, 2, 3, 4, 5)) #define new data as original data minus 4th and 5th factor levels new_data <- data[-c(4, 5)] #view new data new_data [1] 1 2 3 Levels: 1 2 3 4 5
แม้ว่าข้อมูลใหม่จะมีปัจจัยเพียง 3 ปัจจัยเท่านั้น แต่เราจะเห็นได้ว่ายังคงมีระดับปัจจัย 5 ระดับเดิมอยู่
หากต้องการลบระดับปัจจัยที่ไม่ได้ใช้เหล่านี้ เราสามารถใช้ฟังก์ชัน droplevels() ได้:
#drop unused factor levels new_data < -droplevels (new_data) #view data new_data [1] 1 2 3 Levels: 1 2 3
ข้อมูลใหม่ขณะนี้มีเพียงสามระดับของปัจจัย
ตัวอย่างที่ 2: ลบระดับปัจจัยที่ไม่ได้ใช้ในกรอบข้อมูล
สมมติว่าเราสร้างกรอบข้อมูลที่ตัวแปรตัวใดตัวหนึ่งเป็นปัจจัยห้าระดับ ต่อไป สมมติว่าเรากำหนดกรอบข้อมูลใหม่ที่ลบระดับปัจจัยสองระดับเหล่านี้:
#create data frame df <- data. frame (region= factor (c('A', 'B', 'C', 'D', 'E')), sales = c(13, 16, 22, 27, 34)) #view data frame df regional sales 1 to 13 2 B 16 3 C 22 4 D 27 5 E 34 #define new data frame new_df <- subset (df, sales < 25) #view new data frame new_df regional sales 1 to 13 2 B 16 3 C 22 #check levels of region variable levels (new_df$region) [1] “A” “B” “C” “D” “E”
แม้ว่าฐานข้อมูลใหม่จะมีเพียงสามปัจจัยในคอลัมน์ ภูมิภาค แต่ยังคงมีระดับปัจจัยห้าระดับเดิม สิ่งนี้จะสร้างปัญหาหากเราพยายามสร้างแปลงโดยใช้ข้อมูลนี้
หากต้องการลบระดับปัจจัยที่ไม่ได้ใช้ออกจาก ตัวแปรภูมิภาค เราสามารถใช้ฟังก์ชัน droplevels() ได้:
#drop unused factor levels new_df$region <- droplevels (new_df$region) #check levels of region variable levels (new_df$region) [1] “A” “B” “C”
ตอนนี้ตัวแปร ภูมิภาค มีปัจจัยเพียงสามระดับเท่านั้น
คุณสามารถค้นหาบทช่วยสอน R เพิ่มเติมได้ใน หน้านี้