ความสัมพันธ์ใน stata: pearson, spearman และ kendall


ในทางสถิติ ความสัมพันธ์ หมายถึงจุดแข็งและทิศทางของความสัมพันธ์ระหว่างตัวแปรสองตัว ค่าของสัมประสิทธิ์สหสัมพันธ์สามารถอยู่ในช่วงตั้งแต่ -1 ถึง 1 โดย -1 หมายถึงความสัมพันธ์เชิงลบที่สมบูรณ์แบบ 0 หมายถึงไม่มีความสัมพันธ์ และ 1 หมายถึงความสัมพันธ์เชิงบวกที่สมบูรณ์แบบ

มีสามวิธีทั่วไปในการวัดความสัมพันธ์:

Pearson Correlation: ใช้เพื่อวัดความสัมพันธ์ระหว่างตัวแปรต่อเนื่องสองตัว (เช่นส่วนสูงและน้ำหนัก)

Spearman Correlation: ใช้เพื่อวัดความสัมพันธ์ระหว่างตัวแปรจำแนกสองตัว (เช่น การจัดอันดับคะแนนสอบคณิตศาสตร์ของนักเรียนเทียบกับคะแนนสอบวิทยาศาสตร์ในชั้นเรียน)

Kendall’s Correlation: ใช้เมื่อคุณต้องการใช้ความสัมพันธ์ของ Spearman แต่ขนาดตัวอย่างมีขนาดเล็กและมีการจัดอันดับที่เกี่ยวข้องกันมากมาย

บทช่วยสอนนี้จะอธิบายวิธีค้นหาความสัมพันธ์สามประเภทใน Stata

กำลังโหลดข้อมูล

สำหรับแต่ละตัวอย่างต่อไปนี้ เราจะใช้ชุดข้อมูลที่เรียกว่า auto คุณสามารถโหลดชุดข้อมูลนี้ได้โดยพิมพ์ข้อความต่อไปนี้ในกล่องคำสั่ง:

ใช้ https://www.stata-press.com/data/r13/auto

เราสามารถดูภาพรวมโดยย่อของชุดข้อมูลได้โดยพิมพ์คำสั่งต่อไปนี้ในกล่องคำสั่ง:

เพื่อสรุป

สรุปคำสั่งตัวอย่างใน Stata

เราจะเห็นได้ว่าในชุดข้อมูลมีตัวแปรทั้งหมด 12 ตัวแปร

วิธีค้นหาความสัมพันธ์ของเพียร์สันใน Stata

เราสามารถหา ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ระหว่างตัวแปร น้ำหนัก และ ความยาวได้ โดยใช้คำสั่ง pwcorr :

ความยาวน้ำหนัก pwcorr

ความสัมพันธ์แบบเพียร์สันใน Stata

ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันระหว่างตัวแปรทั้งสองนี้คือ 0.9460 เพื่อตรวจสอบว่าสัมประสิทธิ์สหสัมพันธ์นี้มีนัยสำคัญหรือไม่ เราสามารถหาค่าของ p โดยใช้คำสั่ง sig :

ความยาวน้ำหนัก pwcorr sig

ความหมายของความสัมพันธ์แบบเพียร์สันใน Stata

ค่า p คือ 0.000 เนื่องจากค่านี้น้อยกว่า 0.05 ความสัมพันธ์ระหว่างตัวแปรทั้งสองนี้จึงมีนัยสำคัญทางสถิติ

หากต้องการค้นหาค่าสัมประสิทธิ์สหสัมพันธ์แบบ Pearson สำหรับตัวแปรหลายตัว เพียงพิมพ์รายการตัวแปรหลังคำสั่ง pwcorr :

การกระจัดความยาวน้ำหนัก pwcorr sig

ความสัมพันธ์แบบเพียร์สันสำหรับตัวแปรหลายตัวใน Stata

ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:

  • ความสัมพันธ์แบบเพียร์สันระหว่างน้ำหนักและความยาว = 0.9460 | ค่า p = 0.000
  • ความสัมพันธ์แบบเพียร์สันระหว่างน้ำหนักกับการกระจัด = 0.8949 | ค่า p = 0.000
  • ความสัมพันธ์แบบเพียร์สันระหว่างการกระจัดและความยาว = 0.8351 | ค่า p = 0.000

วิธีค้นหาความสัมพันธ์ของ Spearman ใน Stata

เราสามารถค้นหาค่าสัมประสิทธิ์สหสัมพันธ์ของ Spearman ระหว่างตัวแปร trunk และ rep78 ได้โดยใช้คำสั่ง spearman :

แลนซ์ ทรั้งrep78

ความสัมพันธ์ของสเปียร์แมนใน Stata

ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:

  • จำนวน obs: นี่คือจำนวนการสังเกตแบบคู่ที่ใช้ในการคำนวณสัมประสิทธิ์สหสัมพันธ์สเปียร์แมน เนื่องจากค่าบางค่าหายไปสำหรับตัวแปร rep78 Stata จึงใช้การสังเกตเพียง 69 ครั้งต่อคู่ (แทนที่จะเป็น 74 เต็ม)
  • Rho ของ Spearman: นี่คือสัมประสิทธิ์สหสัมพันธ์ของ Spearman ในกรณีนี้คือ -0.2235 ซึ่งบ่งชี้ว่ามีความสัมพันธ์เชิงลบระหว่างตัวแปรทั้งสอง เมื่อคนหนึ่งเพิ่มขึ้น อีกคนก็มีแนวโน้มที่จะลดลง
  • ปัญหา > |t| : นี่คือค่า p ที่เกี่ยวข้องกับการทดสอบสมมติฐาน ในกรณีนี้ ค่า p คือ 0.0649 ซึ่งบ่งชี้ว่าไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทั้งสองที่ α = 0.05

เราสามารถค้นหาค่าสัมประสิทธิ์สหสัมพันธ์สเปียร์แมนสำหรับตัวแปรหลายตัวได้โดยเพียงพิมพ์ตัวแปรเพิ่มเติมหลังคำสั่ง สเปียร์แมน เราสามารถค้นหาค่าสัมประสิทธิ์สหสัมพันธ์และค่า p ที่สอดคล้องกันสำหรับความสัมพันธ์แบบคู่แต่ละค่าได้โดยใช้คำสั่ง stats(rho p) :

spearman trunk rep78 gear_ratio, สถิติ (rho p)

สเปียร์แมนสหสัมพันธ์สำหรับตัวแปรหลายตัวใน Stata

ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:

  • สเปียร์แมนสหสัมพันธ์ระหว่างลำตัวกับตัวแทน 78 = -0.2235 | ค่า p = 0.0649
  • ความสัมพันธ์ของสเปียร์แมนระหว่างลำตัวและอัตราส่วนเกียร์ = -0.5187 | ค่า p = 0.0000
  • ความสัมพันธ์ของสเปียร์แมนระหว่าง gear_ratio และ rep78 = 0.4275 | ค่า p = 0.0002

วิธีค้นหาความสัมพันธ์ของ Kendall ใน Stata

เราสามารถค้นหา ค่าสัมประสิทธิ์สหสัมพันธ์ของ Kendall ระหว่างตัวแปร trunk และ rep78 ได้โดยใช้คำสั่ง ktau :

ktau ลำต้น rep78

ความสัมพันธ์ของเคนดัลล์ในสเตตา

ต่อไปนี้เป็นวิธีการตีความผลลัพธ์:

  • จำนวน obs: นี่คือจำนวนการสังเกตแบบคู่ที่ใช้ในการคำนวณสัมประสิทธิ์สหสัมพันธ์ของเคนดัลล์ เนื่องจากค่าบางค่าหายไปสำหรับตัวแปร rep78 Stata จึงใช้การสังเกตเพียง 69 ครั้งต่อคู่ (แทนที่จะเป็น 74 เต็ม)
  • Tau-b ของ Kendall: นี่คือสัมประสิทธิ์สหสัมพันธ์ของ Kendall ระหว่างตัวแปรทั้งสอง โดยทั่วไปเราใช้ค่านี้แทน tau-a เนื่องจาก tau-b ทำการปรับเปลี่ยนในกรณีที่มีความสัมพันธ์กัน ในกรณีนี้ tau-b = -0.1752 ซึ่งแสดงถึงความสัมพันธ์เชิงลบระหว่างตัวแปรทั้งสอง
  • ปัญหา > |z| : นี่คือค่า p ที่เกี่ยวข้องกับการทดสอบสมมติฐาน ในกรณีนี้ ค่า p คือ 0.0662 ซึ่งบ่งชี้ว่าไม่มีความสัมพันธ์ที่มีนัยสำคัญทางสถิติระหว่างตัวแปรทั้งสองที่ α = 0.05

เราสามารถหาค่าสัมประสิทธิ์สหสัมพันธ์ของ Kendall สำหรับตัวแปรหลายตัวได้โดยเพียงพิมพ์ตัวแปรเพิ่มเติมหลังคำสั่ง ktau เราสามารถหาค่าสัมประสิทธิ์สหสัมพันธ์และค่า p ที่สอดคล้องกันสำหรับความสัมพันธ์แบบคู่แต่ละค่าได้โดยใช้คำสั่ง stats(taub p) :

ktau trunk rep78 gear_ratio, สถิติ (taub p)

Tau ของ Kendall สำหรับตัวแปรหลายตัวใน Stata

  • ความสัมพันธ์ของเคนดัลล์ระหว่างลำตัวกับตัวแทน 78 = -0.1752 | ค่า p = 0.0662
  • ความสัมพันธ์ของ Kendall ระหว่าง trunk และ gear_ratio = -0.3753 | ค่า p = 0.0000
  • ความสัมพันธ์ของเคนดัลล์ระหว่างอัตราส่วนเกียร์กับตัวแทน 78 = 0.3206 | ค่า p = 0.0006

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *