आर में लॉग रैंक टेस्ट कैसे करें
लॉग-रैंक परीक्षण दो समूहों के बीच उत्तरजीविता वक्रों की तुलना करने का सबसे आम तरीका है।
यह परीक्षण निम्नलिखित मान्यताओं का उपयोग करता है:
एच 0 : दोनों समूहों के बीच जीवित रहने में कोई अंतर नहीं है।
एच ए : दोनों समूहों के बीच जीवित रहने में अंतर है ।
यदि परीक्षण का पी-मान एक निश्चित स्तर के महत्व से नीचे है (जैसे α = 0.05), तो हम शून्य परिकल्पना को अस्वीकार कर सकते हैं और निष्कर्ष निकाल सकते हैं कि यह कहने के लिए पर्याप्त सबूत हैं कि दोनों समूहों के बीच अस्तित्व में अंतर है।
R में लॉग-रैंक परीक्षण करने के लिए, हम सर्वाइवल पैकेज से Survdiff() फ़ंक्शन का उपयोग कर सकते हैं, जो निम्नलिखित सिंटैक्स का उपयोग करता है:
Survdiff(उत्तर(समय, स्थिति) ~ भविष्यवक्ता, डेटा)
यह फ़ंक्शन एक ची-स्क्वायर परीक्षण आँकड़ा और संबंधित पी-मान लौटाता है।
निम्नलिखित उदाहरण दिखाता है कि आर में लॉग-रैंक परीक्षण करने के लिए इस फ़ंक्शन का उपयोग कैसे करें।
उदाहरण: आर में लॉग रैंक टेस्ट
इस उदाहरण के लिए, हम सर्वाइवल पैकेज से डिम्बग्रंथि डेटासेट का उपयोग करेंगे। इस डेटासेट में 26 रोगियों के बारे में निम्नलिखित जानकारी है:
- डिम्बग्रंथि के कैंसर का निदान होने के बाद जीवित रहने का समय (महीनों में)।
- जीवित रहने के समय को सेंसर किया गया था या नहीं
- प्राप्त उपचार का प्रकार (आरएक्स = 1 या आरएक्स = 2)
निम्नलिखित कोड दिखाता है कि इस डेटासेट की पहली छह पंक्तियों को कैसे प्रदर्शित किया जाए:
library (survival) #view first six rows of dataset head(ovarian) futime fustat age resid.ds rx ecog.ps 1 59 1 72.3315 2 1 1 2 115 1 74.4932 2 1 1 3 156 1 66.4658 2 1 2 4 421 0 53.3644 2 2 1 5,431 1 50.3397 2 1 1 6 448 0 56.4301 1 1 2
निम्नलिखित कोड दिखाता है कि विभिन्न उपचार प्राप्त करने वाले रोगियों के बीच जीवित रहने में अंतर है या नहीं यह निर्धारित करने के लिए लॉग-रैंक परीक्षण कैसे करें:
#perform log rank test
survdiff(Surv(futime, fustat) ~ rx, data=ovarian)
Call:
survdiff(formula = Surv(futime, fustat) ~ rx, data = ovarian)
N Observed Expected (OE)^2/E (OE)^2/V
rx=1 13 7 5.23 0.596 1.06
rx=2 13 5 6.77 0.461 1.06
Chisq= 1.1 on 1 degrees of freedom, p= 0.3
ची-स्क्वायर परीक्षण आँकड़ा 1.1 है जिसमें 1 डिग्री की स्वतंत्रता है और संबंधित पी-मान 0.3 है। चूँकि यह पी-मान 0.05 से कम नहीं है, हम शून्य परिकल्पना को अस्वीकार करने में विफल रहते हैं।
दूसरे शब्दों में, हमारे पास यह कहने के लिए पर्याप्त सबूत नहीं हैं कि दोनों उपचारों के बीच जीवित रहने में सांख्यिकीय रूप से महत्वपूर्ण अंतर है।
हम निम्नलिखित सिंटैक्स का उपयोग करके प्रत्येक समूह के लिए उत्तरजीविता वक्र भी बना सकते हैं:
#plot survival curves for each treatment group plot(survfit(Surv(futime, fustat) ~ rx, data = ovarian), xlab = " Time ", ylab = “ Overall survival probability ”)
हम देख सकते हैं कि उत्तरजीविता वक्र थोड़े अलग हैं, लेकिन लॉग-रैंक परीक्षण ने हमें बताया कि अंतर सांख्यिकीय रूप से महत्वपूर्ण नहीं है।