ความสัมพันธ์ใน stata: pearson, spearman และ kendall
ในทางสถิติ ความสัมพันธ์ หมายถึงจุดแข็งและทิศทางของความสัมพันธ์ระหว่างตัวแปรสองตัว ค่าของสัมประสิทธิ์สหสัมพันธ์สามารถอยู่ในช่วงตั้งแต่ -1 ถึง 1 โดย -1 หมายถึงความสัมพันธ์เชิงลบที่สมบูรณ์แบบ 0 หมายถึงไม่มีความสัมพันธ์ และ 1 หมายถึงความสัมพันธ์เชิงบวกที่สมบูรณ์แบบ
มีสามวิธีทั่วไปในการวัดความสัมพันธ์:
Pearson Correlation: ใช้เพื่อวัดความสัมพันธ์ระหว่างตัวแปรต่อเนื่องสองตัว (เช่นส่วนสูงและน้ำหนัก)
Spearman Correlation: ใช้เพื่อวัดความสัมพันธ์ระหว่างตัวแปรจำแนกสองตัว (เช่น การจัดอันดับคะแนนสอบคณิตศาสตร์ของนักเรียนเทียบกับคะแนนสอบวิทยาศาสตร์ในชั้นเรียน)
Kendall’s Correlation: ใช้เมื่อคุณต้องการใช้ความสัมพันธ์ของ Spearman แต่ขนาดตัวอย่างมีขนาดเล็กและมีการจัดอันดับที่เกี่ยวข้องกันมากมาย
บทช่วยสอนนี้จะอธิบายวิธีค้นหาความสัมพันธ์สามประเภทใน Stata
กำลังโหลดข้อมูล
สำหรับแต่ละตัวอย่างต่อไปนี้ เราจะใช้ชุดข้อมูลที่เรียกว่า auto คุณสามารถโหลดชุดข้อมูลนี้ได้โดยพิมพ์ข้อความต่อไปนี้ในกล่องคำสั่ง:
ใช้ https://www.stata-press.com/data/r13/auto
เราสามารถดูภาพรวมโดยย่อของชุดข้อมูลได้โดยพิมพ์คำสั่งต่อไปนี้ในกล่องคำสั่ง:
เพื่อสรุป
เราจะเห็นได้ว่าในชุดข้อมูลมีตัวแปรทั้งหมด 12 ตัวแปร
วิธีค้นหาความสัมพันธ์ของเพียร์สันใน Stata
เราสามารถหา ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ระหว่างตัวแปร น้ำหนัก และ ความยาวได้ โดยใช้คำสั่ง pwcorr :
ความยาวน้ำหนัก pwcorr
ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันระหว่างตัวแปรทั้งสองนี้คือ 0.9460 เพื่อตรวจสอบว่าสัมประสิทธิ์สหสัมพันธ์นี้มีนัยสำคัญหรือไม่ เราสามารถหาค่าของ p โดยใช้คำสั่ง sig :
ความยาวน้ำหนัก pwcorr sig
ค่า p คือ 0.000 เนื่องจากค่านี้น้อยกว่า 0.05 ความสัมพันธ์ระหว่างตัวแปรทั้งสองนี้จึงมีนัยสำคัญทางสถิติ
หากต้องการค้นหาค่าสัมประสิทธิ์สหสัมพันธ์แบบ Pearson สำหรับตัวแปรหลายตัว เพียงพิมพ์รายการตัวแปรหลังคำสั่ง pwcorr :
การกระจัดความยาวน้ำหนัก pwcorr sig
ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:
- ความสัมพันธ์แบบเพียร์สันระหว่างน้ำหนักและความยาว = 0.9460 | ค่า p = 0.000
- ความสัมพันธ์แบบเพียร์สันระหว่างน้ำหนักกับการกระจัด = 0.8949 | ค่า p = 0.000
- ความสัมพันธ์แบบเพียร์สันระหว่างการกระจัดและความยาว = 0.8351 | ค่า p = 0.000
วิธีค้นหาความสัมพันธ์ของ Spearman ใน Stata
เราสามารถค้นหาค่าสัมประสิทธิ์สหสัมพันธ์ของ Spearman ระหว่างตัวแปร trunk และ rep78 ได้โดยใช้คำสั่ง spearman :
แลนซ์ ทรั้งrep78
ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:
- จำนวน obs: นี่คือจำนวนการสังเกตแบบคู่ที่ใช้ในการคำนวณสัมประสิทธิ์สหสัมพันธ์สเปียร์แมน เนื่องจากค่าบางค่าหายไปสำหรับตัวแปร rep78 Stata จึงใช้การสังเกตเพียง 69 ครั้งต่อคู่ (แทนที่จะเป็น 74 เต็ม)
- Rho ของ Spearman: นี่คือสัมประสิทธิ์สหสัมพันธ์ของ Spearman ในกรณีนี้คือ -0.2235 ซึ่งบ่งชี้ว่ามีความสัมพันธ์เชิงลบระหว่างตัวแปรทั้งสอง เมื่อคนหนึ่งเพิ่มขึ้น อีกคนก็มีแนวโน้มที่จะลดลง
- ปัญหา > |t| : นี่คือค่า p ที่เกี่ยวข้องกับการทดสอบสมมติฐาน ในกรณีนี้ ค่า p คือ 0.0649 ซึ่งบ่งชี้ว่าไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทั้งสองที่ α = 0.05
เราสามารถค้นหาค่าสัมประสิทธิ์สหสัมพันธ์สเปียร์แมนสำหรับตัวแปรหลายตัวได้โดยเพียงพิมพ์ตัวแปรเพิ่มเติมหลังคำสั่ง สเปียร์แมน เราสามารถค้นหาค่าสัมประสิทธิ์สหสัมพันธ์และค่า p ที่สอดคล้องกันสำหรับความสัมพันธ์แบบคู่แต่ละค่าได้โดยใช้คำสั่ง stats(rho p) :
spearman trunk rep78 gear_ratio, สถิติ (rho p)
ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:
- สเปียร์แมนสหสัมพันธ์ระหว่างลำตัวกับตัวแทน 78 = -0.2235 | ค่า p = 0.0649
- ความสัมพันธ์ของสเปียร์แมนระหว่างลำตัวและอัตราส่วนเกียร์ = -0.5187 | ค่า p = 0.0000
- ความสัมพันธ์ของสเปียร์แมนระหว่าง gear_ratio และ rep78 = 0.4275 | ค่า p = 0.0002
วิธีค้นหาความสัมพันธ์ของ Kendall ใน Stata
เราสามารถค้นหา ค่าสัมประสิทธิ์สหสัมพันธ์ของ Kendall ระหว่างตัวแปร trunk และ rep78 ได้โดยใช้คำสั่ง ktau :
ktau ลำต้น rep78
ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:
- จำนวน obs: นี่คือจำนวนการสังเกตแบบคู่ที่ใช้ในการคำนวณสัมประสิทธิ์สหสัมพันธ์ของเคนดัลล์ เนื่องจากค่าบางค่าหายไปสำหรับตัวแปร rep78 Stata จึงใช้การสังเกตเพียง 69 ครั้งต่อคู่ (แทนที่จะเป็น 74 เต็ม)
- Tau-b ของ Kendall: นี่คือสัมประสิทธิ์สหสัมพันธ์ของ Kendall ระหว่างตัวแปรทั้งสอง โดยทั่วไปเราใช้ค่านี้แทน tau-a เนื่องจาก tau-b ทำการปรับเปลี่ยนในกรณีที่มีความสัมพันธ์กัน ในกรณีนี้ tau-b = -0.1752 ซึ่งแสดงถึงความสัมพันธ์เชิงลบระหว่างตัวแปรทั้งสอง
- ปัญหา > |z| : นี่คือค่า p ที่เกี่ยวข้องกับการทดสอบสมมติฐาน ในกรณีนี้ ค่า p คือ 0.0662 ซึ่งบ่งชี้ว่าไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทั้งสองที่ α = 0.05
เราสามารถหาค่าสัมประสิทธิ์สหสัมพันธ์ของ Kendall สำหรับตัวแปรหลายตัวได้โดยเพียงพิมพ์ตัวแปรเพิ่มเติมหลังคำสั่ง ktau เราสามารถหาค่าสัมประสิทธิ์สหสัมพันธ์และค่า p ที่สอดคล้องกันสำหรับความสัมพันธ์แบบคู่แต่ละค่าได้โดยใช้คำสั่ง stats(taub p) :
ktau trunk rep78 gear_ratio, สถิติ (taub p)
- ความสัมพันธ์ของเคนดัลล์ระหว่างลำตัวกับตัวแทน 78 = -0.1752 | ค่า p = 0.0662
- ความสัมพันธ์ของ Kendall ระหว่าง trunk และ gear_ratio = -0.3753 | ค่า p = 0.0000
- ความสัมพันธ์ของเคนดัลล์ระหว่างอัตราส่วนเกียร์กับตัวแทน 78 = 0.3206 | ค่า p = 0.0006