วิธีสร้างเมทริกซ์สหสัมพันธ์ใน stata


ในทางสถิติ เรามักจะพยายามทำความเข้าใจความสัมพันธ์ระหว่างตัวแปรสองตัว ตัวอย่างเช่น เราอาจต้องการทำความเข้าใจความสัมพันธ์ระหว่างจำนวนชั่วโมงที่นักเรียนเรียนกับเกรดที่พวกเขาได้รับจากการสอบ

วิธีหนึ่งในการหาปริมาณความสัมพันธ์นี้คือการใช้ สัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน ซึ่ง เป็นหน่วยวัดความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว มีค่าระหว่าง -1 ถึง 1 โดยที่:

  • -1 บ่งชี้ถึงความสัมพันธ์เชิงเส้นเชิงลบอย่างสมบูรณ์ระหว่างตัวแปรสองตัว
  • 0 บ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรสองตัว
  • 1 บ่งชี้ความสัมพันธ์เชิงเส้นเชิงบวกอย่างสมบูรณ์ระหว่างตัวแปรสองตัว

ยิ่งค่าสัมประสิทธิ์สหสัมพันธ์จากศูนย์มากเท่าใด ความสัมพันธ์ระหว่างตัวแปรทั้งสองก็จะยิ่งแข็งแกร่งขึ้นเท่านั้น

แต่ในบางกรณี เราต้องการเข้าใจความสัมพันธ์ระหว่างตัวแปรหลายคู่ ในกรณีเหล่านี้ เราสามารถสร้าง เมทริกซ์สหสัมพันธ์ ซึ่งเป็นตารางสี่เหลี่ยมที่แสดงค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างการผสมตัวแปรหลายคู่ตามลำดับ

ในบทช่วยสอนนี้ เราจะอธิบายวิธีสร้างเมทริกซ์สหสัมพันธ์ใน Stata

วิธีสร้างเมทริกซ์สหสัมพันธ์ใน Stata

คำสั่ง corr สามารถใช้เพื่อสร้างเมทริกซ์สหสัมพันธ์สำหรับชุดข้อมูลเฉพาะใน Stata

เพื่ออธิบายสิ่งนี้ ลองโหลดข้อมูลการสำรวจสำมะโนประชากรปี 1980 ลงใน Stata โดยพิมพ์ข้อความต่อไปนี้ในกล่องคำสั่ง:

ใช้ https://www.stata-press.com/data/r13/census13

จากนั้นเราสามารถรับข้อมูลสรุปโดยย่อของชุดข้อมูลโดยพิมพ์คำสั่งต่อไปนี้ลงในกล่องคำสั่ง:

เพื่อสรุป

สิ่งนี้จะสร้างตารางต่อไปนี้:

เมทริกซ์สหสัมพันธ์ใน Stata

เราเห็นว่าชุดข้อมูลมีตัวแปรที่แตกต่างกันเก้าตัว ในการสร้างเมทริกซ์สหสัมพันธ์สำหรับการรวมตัวแปรในชุดข้อมูลแต่ละคู่ เราสามารถป้อนข้อมูลต่อไปนี้ในกล่องคำสั่ง:

ถูกต้อง

สิ่งนี้จะสร้างเมทริกซ์สหสัมพันธ์ต่อไปนี้:

ตัวอย่างเมทริกซ์สหสัมพันธ์ใน Stata

ตัวเลขที่แสดงในตารางแสดงถึงค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันสำหรับการรวมตัวแปรแต่ละคู่แบบคู่ ตัวอย่างเช่น ความสัมพันธ์ระหว่าง ประชากร และ รัฐ คือ -0.0540 สิ่งนี้บ่งชี้ว่าตัวแปรทั้งสองนี้มีความสัมพันธ์เชิงลบเล็กน้อย

โปรดทราบว่าความสัมพันธ์ตามเส้นทแยงมุมของตารางคือ 1.0000 เนื่องจากตัวแปรแต่ละตัวมีความสัมพันธ์อย่างสมบูรณ์กับตัวมันเอง

คุณยังสามารถสร้างเมทริกซ์สหสัมพันธ์สำหรับชุดย่อยบางชุดของตัวแปรในชุดข้อมูลได้โดยการระบุตัวแปรหลังคำสั่ง corr ตัวอย่างเช่น ต่อไปนี้เป็นวิธีสร้างเมทริกซ์สหสัมพันธ์สำหรับตัวแปร pop , medage และ ขอบเขต :

ภูมิภาค Medage ของ Corr

สิ่งนี้จะสร้างเมทริกซ์สหสัมพันธ์ต่อไปนี้สำหรับตัวแปรทั้งสามนี้เท่านั้น:

ตัวอย่างเมทริกซ์สหสัมพันธ์ใน Stata

นอกจากนี้ยังสามารถติดดาวไว้ถัดจากค่าสัมประสิทธิ์สหสัมพันธ์ที่มีนัยสำคัญทางสถิติที่ระดับนัยสำคัญระดับหนึ่งได้โดยใช้คำสั่ง pwcorr (ซึ่งให้ผลลัพธ์เหมือนกับ corr ) ด้วยคำสั่ง star()

ตัวอย่างเช่น รหัสต่อไปนี้จะสร้างเมทริกซ์สหสัมพันธ์สำหรับตัวแปรแต่ละตัวในชุดข้อมูลการสำรวจสำมะโนประชากร และวางดาวไว้ถัดจากค่าสัมประสิทธิ์สหสัมพันธ์ซึ่งมีนัยสำคัญทางสถิติที่ α = 0.05:

pwcorr สตาร์ (.05)

เมทริกซ์สหสัมพันธ์ที่มีนัยสำคัญทางสถิติใน Stata

สังเกตว่าค่าสัมประสิทธิ์สหสัมพันธ์หลายค่าในตารางมีนัยสำคัญทางสถิติที่ α = 0.05 อย่างไร เราสามารถตั้งค่า α เป็นตัวเลขใดก็ได้ที่เราต้องการ แต่ตัวเลือกทั่วไปคือ 0.01, 0.05 และ 0.10

โดยทั่วไป ยิ่งค่า α มีค่าต่ำ ค่าสัมประสิทธิ์สหสัมพันธ์จะมีนัยสำคัญทางสถิติน้อยลง ตัวอย่างเช่น สมมติว่าเราตั้งค่า α = 0.01

pwcorr สตาร์ (.01)

เมทริกซ์สหสัมพันธ์ใน Stata

สังเกตว่าค่าสัมประสิทธิ์สหสัมพันธ์มีดาวอยู่ข้างๆ น้อยลงเพียงใด

เพิ่มความคิดเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *