วิธีใช้ตัวดำเนินการ tilde (~) ใน r
คุณสามารถใช้ตัวดำเนินการเครื่องหมายทิลเดอ ( ~ ) ใน R เพื่อแยกด้านซ้ายของสมการออกจากด้านขวาได้
โอเปอเรเตอร์นี้มักใช้กับฟังก์ชัน lm() ใน R ซึ่งใช้เพื่อให้พอดีกับ โมเดลการถดถอยเชิงเส้น
ไวยากรณ์พื้นฐานของฟังก์ชัน lm() คือ:
model <- lm(y ~ x1 + x2, data=df)
ชื่อตัวแปร ทางด้านซ้าย ของตัวดำเนินการเครื่องหมายทิลเดอ (y) แสดงถึง ตัวแปรตอบสนอง
ชื่อตัวแปรทาง ด้านขวา ของตัวดำเนินการตัวหนอน (x1, x2) แสดงถึง ตัวแปรทำนาย
ตัวอย่างต่อไปนี้แสดงวิธีใช้ตัวดำเนินการเครื่องหมายทิลเดอในสถานการณ์ต่างๆ
ตัวอย่างที่ 1: การใช้ตัวดำเนินการตัวหนอนกับตัวแปรทำนาย
สมมติว่าเราใส่โมเดลการถดถอยเชิงเส้นอย่างง่ายต่อไปนี้ใน R:
model <- lm(y ~ x, data=df)
โมเดลการถดถอยเฉพาะนี้มีตัวแปรตอบสนอง (y) และตัวแปรทำนาย (x)
หากเราเขียนสมการการถดถอยนี้ในรูปแบบทางสถิติ มันจะมีลักษณะดังนี้:
y = β 0 + β 1 x
ตัวอย่างที่ 2: การใช้ตัวดำเนินการตัวหนอนกับตัวแปรทำนายหลายตัว
สมมติว่าเราใส่โมเดลการถดถอยเชิงเส้นพหุคูณต่อไปนี้ใน R:
model <- lm(y ~ x1 + x2 + x3, data=df)
โมเดลการถดถอยเฉพาะนี้มีตัวแปรตอบสนองหนึ่งตัว (y) และตัวแปรทำนายสามตัว (x1, x2, x3)
หากเราเขียนสมการการถดถอยนี้ในรูปแบบทางสถิติ มันจะมีลักษณะดังนี้:
y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3
ตัวอย่างที่ 3: การใช้ตัวดำเนินการตัวหนอนกับตัวแปรทำนายจำนวนที่ไม่รู้จัก
สมมติว่าเราใส่โมเดลการถดถอยเชิงเส้นพหุคูณต่อไปนี้ใน R:
model <- lm(y ~ ., data=df)
ไวยากรณ์เฉพาะนี้บ่งชี้ว่าเราต้องการใช้ y เป็นตัวแปรตอบสนองและตัวแปรอื่นๆ ทั้งหมดในกรอบข้อมูลเป็นตัวแปรทำนาย
ไวยากรณ์นี้มีประโยชน์เมื่อเราต้องการปรับโมเดลการถดถอยให้พอดีกับตัวแปรทำนายจำนวนมาก แต่เราไม่ต้องการป้อนชื่อเฉพาะของตัวแปรทำนายแต่ละตัว
แหล่งข้อมูลเพิ่มเติม
บทช่วยสอนต่อไปนี้จะอธิบายวิธีใช้ฟังก์ชันทั่วไปอื่นๆ ใน R:
วิธีใช้ตัวดำเนินการเครื่องหมายดอลลาร์ ($) ใน R
วิธีใช้ตัวดำเนินการ “NOT IN” ใน R
วิธีใช้ตัวดำเนินการ %in% ใน R