MODEL REGRESI WEIBULL UNTUK SURVIVAL ANALYSIS


Tujuan utama dari survival analysis adalah untuk memodelkan dan menganalisis data time to event; yaitu data yang memiliki batas waktu usia dari suatu kejadian atau events. Kejadian itu disebut dengan ‘failures’. Beberapa contoh antara lain: waktu sampai komponen elektronik rusak, waktu kematian, waktu untuk mempelajari suatu keahlian.

Dalam contoh diatas terlihat bahwa mungkin saja suatu failure time tak teramati baik karena rancangan percobaannya ataupun karena random censoring. Misalnya ternyata pasien masih hidup sampai akhir dari suatu percobaan klinis. Survival analisis adalah suatu istilah modern yang diberikan terhadap sekumpulan prosedur statistik yang mengakomodasi time to event censored data.

Dalam tulisan ini hanya akan memfokuskan pada model regresi dengan Weibull Model.

  1. Weibul Model
    1. Distribusi Weibull

      Fungsi densitas peluang Weibull merupakan suatu distribusi peluang yang penting dalam mengkarakterisasi perilaku probabilistik sejumlah besar fenomena dalam dunia riil. Distribusi Weibull terutama sangat berguna sebagai failure model dalam menganalisis realibilitas sistem yang berlainan jenis.

      Misal T adalah failure time dan T berdistribusi Weibull, maka T merupakan suatu variabel random positif dengan fungsi densitas diberikan sebagai berikut:

      ,

      dimana α > 0 merupakan shape parameter dan μ > 0 merupakan scale parameter. Sehingga secara umum memiliki nilai ekspektasi T berikut:

      dan fungsi distribusi kumulatif sebagai berikut:

    2. Survivor dan Hazard Function

      Survivor function didefinisikan sebagai S(t) = 1 – F(t), sehingga diperoleh:

      S(t) = exp(-(t/μ)α)

      Dari formula h(t) = f(t) / S(t), maka diperoleh hazard function sebagai berikut:

      Berikut ini adalah gambaran secara grafis hubungan antara hazard function dan survivor function yang terkait:

    3. Fungsi Likelihood untuk data survival

      Misal terdapat pengamatan independen (ti, δi), i = 1, …, n dimana ti adalah survival time dan δi adalah indikator censoring dengan:

δi =

1, jika pengamatan ke-i not censored
0, jika pengamatan ke-i censored

Dan misal θ adalah parameter yang tidak diketahui, maka fungsi Likelihood-nya adalah sebagai berikut:

  1. Weibull proportional hazard model

    Pertama dilakukan reparameterisasi dari model Weibull dengan menggunakan λ, dimana:

    λ = μ, sehingga diperoleh:

    Misal x = {x(1), …, x(m)} adalah vektor kovariat yang ada, sehingga fungsi hazard menjadi sebagai berikut:

    dimana

    , atau fungsi diatas bisa juga ditulis sebagai berikut:

    Model mengasumsikan bahwa individual ke-i dan ke-j dengan kovariat xi dan xj memiliki proportional hazard function sebagai berikut:

    Besaran nilai exp(βi) bisa diinterpretasikan sebagai Hazard Ratio.

  2. Simulasi dengan MATLAB

    Dalam MATLAB, diperlukan Statistics Toolbox untuk menjalankan baris perintah berikut.

    Bangkitkan data prediktor y berdistribusi Weibull dengan prediktor x, dengan baris perintah sebagai berikut:

    x = 4*rand(100,1);

    A = 50*exp(-0.5*x); B = 2;

    y = wblrnd(A,B);

    Kemudian lakukan fitting pada model Cox dengan perintah berikut:

    [b,logL,H,stats] = coxphfit(x,y);
    

    Tampilkan dalam grafik estimasi Cox dengan menggunakan baseline fungsi survivor bersama dengan fungsi Weibull yang telah diketahui sebagai berikut:

stairs(H(:,1),exp(-H(:,2)))

xx = linspace(0,100);

line(xx,1-wblcdf(xx,50*exp(-0.5*mean(x)),B),'color','r')

xlim([0,50])

legend('Survivor Function','Weibull Function')

Referensi

Tableman, Mara; Kim, Jong Sung. Survival Analysis Using S: Analysis of time-to-event data. 2004. Chapman & Hall. Boca Raton

– .Regression Model for Survival Analysis.

3 Responses

  1. oo gihtu, makasih kak Budi,
    ada bahan terkait censored survival analyisis tak? klo ada minta tolong share ya kak..

    penelitian saya primer, terkait daya tahan perusahaan batik, yang awalnya ribuan tapi karna satu dan lain hal banyak yang mati, dan akhirnya saya ambil periode 2000-2010 yang tinggal 20a perusahaan itu*hooo, maaf malah curhat😀

  2. kak Budi mau tanya dunk..kalau misalkan pke analisis survival kerja di populasi data primer dengan N=20 dan data banyak yang tersensor, maksudnya banyak yang belum “gagal/mati” sampai batas waktu yang ditentukan,,misal dari 20 cuma 2 yang tidak tersensor itu gimana kak?
    bagus gak si kita terfokus atau lebih bicara tentang ketahanannya..terimakasih kak..
    endri STIS angkatan 49^^

    • ya berarti kita memang bicara censored survival analyisis, dalam kondisi itu kita bicara ketahanan saja. Dalam praktiknya juga sangat jarang bisa melakukan pengamatan sampai selesai, apalagi untuk barang yang tahan lama.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: