วิธีสร้างเมทริกซ์สหสัมพันธ์ใน stata
ในทางสถิติ เรามักจะพยายามทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรสองตัว ตัวอย่างเช่น เราอาจต้องการทำความเข้าใจความสัมพันธ์ระหว่างจำนวนชั่วโมงที่นักเรียนเรียนกับเกรดที่พวกเขาได้รับจากการสอบ
วิธีหนึ่งในการหาปริมาณความสัมพันธ์นี้คือการใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ซึ่ง เป็นหน่วยวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว มีค่าระหว่าง -1 ถึง 1 โดยที่:
- -1 บ่งชี้ถึงความสัมพันธ์เชิงเส้นเชิงลบอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
- 0 บ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
- 1 บ่งชี้ความสัมพันธ์เชิงเส้นเชิงบวกอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
ยิ่งค่าสัมประสิทธิ์สหสัมพันธ์จากศูนย์มากเท่าใด ความสัมพันธ์ระหว่างตัวแปรทั้งสองก็จะยิ่งแข็งแกร่งขึ้นเท่านั้น
แต่ในบางกรณี เราต้องการเข้าใจความสัมพันธ์ระหว่างตัวแปรหลายคู่ ในกรณีเหล่านี้ เราสามารถสร้าง เมทริกซ์สหสัมพันธ์ ซึ่งเป็นตารางสี่เหลี่ยมที่แสดงค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างการผสมตัวแปรหลายคู่ตามลำดับ
ในบทช่วยสอนนี้ เราจะอธิบายวิธีสร้างเมทริกซ์สหสัมพันธ์ใน Stata
วิธีสร้างเมทริกซ์สหสัมพันธ์ใน Stata
คำสั่ง corr สามารถใช้เพื่อสร้างเมทริกซ์สหสัมพันธ์สำหรับชุดข้อมูลเฉพาะใน Stata
เพื่ออธิบายสิ่งนี้ ลองโหลดข้อมูลการสำรวจสำมะโนประชากรปี 1980 ลงใน Stata โดยพิมพ์ข้อความต่อไปนี้ในกล่องคำสั่ง:
ใช้ https://www.stata-press.com/data/r13/census13
จากนั้นเราสามารถรับข้อมูลสรุปโดยย่อของชุดข้อมูลโดยพิมพ์คำสั่งต่อไปนี้ลงในกล่องคำสั่ง:
เพื่อสรุป
สิ่งนี้จะสร้างตารางต่อไปนี้:
เราเห็นว่าชุดข้อมูลมีตัวแปรที่แตกต่างกันเก้าตัว ในการสร้างเมทริกซ์สหสัมพันธ์สำหรับการรวมตัวแปรในชุดข้อมูลแต่ละคู่ เราสามารถป้อนข้อมูลต่อไปนี้ในกล่องคำสั่ง:
ถูกต้อง
สิ่งนี้จะสร้างเมทริกซ์สหสัมพันธ์ต่อไปนี้:
ตัวเลขที่แสดงในตารางแสดงถึงค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันสำหรับการรวมตัวแปรแต่ละคู่แบบคู่ ตัวอย่างเช่น ความสัมพันธ์ระหว่าง ประชากร และ รัฐ คือ -0.0540 สิ่งนี้บ่งชี้ว่าตัวแปรทั้งสองนี้มีความสัมพันธ์เชิงลบเล็กน้อย
โปรดทราบว่าความสัมพันธ์ตามเส้นทแยงมุมของตารางคือ 1.0000 เนื่องจากตัวแปรแต่ละตัวมีความสัมพันธ์อย่างสมบูรณ์กับตัวมันเอง
คุณยังสามารถสร้างเมทริกซ์สหสัมพันธ์สำหรับชุดย่อยบางชุดของตัวแปรในชุดข้อมูลได้โดยการระบุตัวแปรหลังคำสั่ง corr ตัวอย่างเช่น ต่อไปนี้เป็นวิธีสร้างเมทริกซ์สหสัมพันธ์สำหรับตัวแปร pop , medage และ ขอบเขต :
ภูมิภาค Medage ของ Corr
สิ่งนี้จะสร้างเมทริกซ์สหสัมพันธ์ต่อไปนี้สำหรับตัวแปรทั้งสามนี้เท่านั้น:
นอกจากนี้ยังสามารถติดดาวไว้ถัดจากค่าสัมประสิทธิ์สหสัมพันธ์ที่มีนัยสำคัญทางสถิติที่ระดับนัยสำคัญระดับหนึ่งได้โดยใช้คำสั่ง pwcorr (ซึ่งให้ผลลัพธ์เหมือนกับ corr ) ด้วยคำสั่ง star()
ตัวอย่างเช่น รหัสต่อไปนี้จะสร้างเมทริกซ์สหสัมพันธ์สำหรับตัวแปรแต่ละตัวในชุดข้อมูลการสำรวจสำมะโนประชากร และวางดาวไว้ถัดจากค่าสัมประสิทธิ์สหสัมพันธ์ซึ่งมีนัยสำคัญทางสถิติที่ α = 0.05:
pwcorr สตาร์ (.05)
สังเกตว่าค่าสัมประสิทธิ์สหสัมพันธ์หลายค่าในตารางมีนัยสำคัญทางสถิติที่ α = 0.05 อย่างไร เราสามารถตั้งค่า α เป็นตัวเลขใดก็ได้ที่เราต้องการ แต่ตัวเลือกทั่วไปคือ 0.01, 0.05 และ 0.10
โดยทั่วไป ยิ่งค่า α มีค่าต่ำ ค่าสัมประสิทธิ์สหสัมพันธ์จะมีนัยสำคัญทางสถิติน้อยลง ตัวอย่างเช่น สมมติว่าเราตั้งค่า α = 0.01
pwcorr สตาร์ (.01)
สังเกตว่าค่าสัมประสิทธิ์สหสัมพันธ์มีดาวอยู่ข้างๆ น้อยลงเพียงใด