Jak wykonać test log rank w r


Test log-rank jest najczęstszym sposobem porównywania krzywych przeżycia między dwiema grupami.

W tym teście przyjęto następujące założenia :

H 0 : Nie ma różnicy w przeżyciu pomiędzy obiema grupami.

H A : Istnieje różnica w przeżywalności pomiędzy obiema grupami.

Jeśli wartość p testu jest poniżej pewnego poziomu istotności (np. α = 0,05), wówczas możemy odrzucić hipotezę zerową i stwierdzić, że istnieją wystarczające dowody, aby stwierdzić, że istnieje różnica w przeżywalności pomiędzy obiema grupami.

Aby wykonać test log-rank w R, możemy użyć funkcji survdiff() z pakietu survival , która wykorzystuje następującą składnię:

survdiff(Surv(czas, status) ~ predyktory, dane)

Ta funkcja zwraca statystykę testu chi-kwadrat i odpowiadającą jej wartość p.

Poniższy przykład pokazuje, jak używać tej funkcji do wykonywania testu log-rank w języku R.

Przykład: Test Log Rank w R

W tym przykładzie użyjemy zestawu danych dotyczących jajników z pakietu przeżycia . Ten zbiór danych zawiera następujące informacje na temat 26 pacjentów:

  • Czas przeżycia (w miesiącach) po zdiagnozowaniu raka jajnika
  • Niezależnie od tego, czy czas przetrwania był cenzurowany
  • Rodzaj otrzymanego leczenia (rx = 1 lub rx = 2)

Poniższy kod pokazuje, jak wyświetlić pierwsze sześć wierszy tego zbioru danych:

 library (survival)

#view first six rows of dataset
head(ovarian)

  futime fustat age resid.ds rx ecog.ps
1 59 1 72.3315 2 1 1
2 115 1 74.4932 2 1 1
3 156 1 66.4658 2 1 2
4 421 0 53.3644 2 2 1
5,431 1 50.3397 2 1 1
6 448 0 56.4301 1 1 2

Poniższy kod pokazuje, jak przeprowadzić test log-rank w celu ustalenia, czy istnieje różnica w przeżyciu między pacjentami, którzy otrzymali różne metody leczenia:

 #perform log rank test
survdiff(Surv(futime, fustat) ~ rx, data=ovarian)

Call:
survdiff(formula = Surv(futime, fustat) ~ rx, data = ovarian)

      N Observed Expected (OE)^2/E (OE)^2/V
rx=1 13 7 5.23 0.596 1.06
rx=2 13 5 6.77 0.461 1.06

 Chisq= 1.1 on 1 degrees of freedom, p= 0.3 

Statystyka testu Chi-kwadrat wynosi 1,1 z 1 stopniem swobody, a odpowiadająca jej wartość p wynosi 0,3 . Ponieważ ta wartość p jest nie mniejsza niż 0,05, nie możemy odrzucić hipotezy zerowej.

Innymi słowy, nie mamy wystarczających dowodów, aby stwierdzić, że istnieje statystycznie istotna różnica w przeżyciu pomiędzy tymi dwoma sposobami leczenia.

Możemy również wykreślić krzywe przeżycia dla każdej grupy, używając następującej składni:

 #plot survival curves for each treatment group
plot(survfit(Surv(futime, fustat) ~ rx, data = ovarian), 
     xlab = " Time ", 
     ylab = “ Overall survival probability ”)

Wykres krzywych przeżycia w R

Widzimy, że krzywe przeżycia są nieco inne, ale test log-rank powiedział nam, że różnica nie jest istotna statystycznie.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *