stka_analyza_prezivania_prezentacia_LS2016.pdf

Podobné dokumenty
Teória pravdepodobnosti Zákony velkých císel

Univerzita Karlova v Praze Matematicko-fyzikální fakulta BAKALÁRSKA PRÁCA Monika Jakubcová Štatistická analýza cenzorovaných dát Katedra pravdepodobno

Základné stochastické procesy vo financiách

Operačná analýza 2

Snímka 1

Metódy dokazovanie v matematike 1 Základné pojmy Matematika exaktná veda vybudovaná DEDUKTÍVNE ZÁKLADNÉ POJMY základy každej matematickej teórie sú in

Analýza přežití s programem STATISTICA

SRPkapitola06_v1.docx

Viacnásobne použitelné oblasti spolahlivosti pre viacrozmernú kalibráciu

Numerické riešenie všeobecnej (klasickej) DMPK rovnice.

III. Diferenciálny počet funkcie viac premenných (Prezentácia k prednáškam, čast B) Matematická analýza IV (ÚMV/MAN2d/10) RNDr. Lenka Halčinová, PhD.

Preco kocka stací? - o tom, ako sú rozdelené vlastné hodnoty laplasiánu v limite, ked sú velké

Prenosový kanál a jeho kapacita

Models of marital status and childbearing

Microsoft Word - Li-Fraumeni syndrom.docx

4. Pravidlo ret azenia. Často sa stretávame so skupinami premenných, ktoré zložitým spôsobom závisia od iných skupín premenných. Pravidlo ret azenia p

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy Beáta Stehlíková Časové rady, FMFI UK, 2011/2012 Jednotkový koreň(unit roo

2.5. Dotyčnica krivky, dotykový kužeľ. Nech f je krivka a nech P V (f) (t.j. m P (f) 1). Ak m P (f) = r a l je taká priamka, že I P (f, l) > r, potom

8

Klasická metóda CPM

WP summary

Paralelné algoritmy, cast c. 2

PowerPoint Presentation

Microsoft Word - skripta3b.doc

Didaktické testy

Axióma výberu

6 Kapitola 6 Výsledky vyšetrení počas projektov Lekári idú do ulíc a MOST 2008 Počas mesiacov júl a august v rámci projektu Lekári idú do ulíc a počas

PRÍČINY A DÔSLEDKY STAVU ŽIVOTNÉHO PROSTREDIA Zdravie sa musí chrániť starostlivosťou o zdravé životné podmienky, ktoré sú dané stavom ovzdušia, vody,

1

Pokrocilé programovanie XI - Diagonalizácia matíc

Matematika 2 - cast: Funkcia viac premenných

Neineárne programovanie zimný semester 2018/19 M. Trnovská, KAMŠ, FMFI UK 1

MO_pred1

Rozdiely v incidencii nadorov u obyvatelov zijucich v meste a na vidieku

Familiárna Stredomorská Horúčka Verzia DIAGNÓZA A LIEČBA 2.1 Ako sa choroba diagnostikuj

Kazuistika 1

Slide 1

Roche Template

Vzorové riešenia úlohy 4.1 Bodovanie Úvod do TI 2010 Dôvod prečo veľa z Vás malo málo bodov bolo to, že ste sa nepokúsili svoje tvrdenia dokázať, prič

Stat1_CV1 VES

Oceňovanie amerických opcií p. 1/17 Oceňovanie amerických opcií Beáta Stehlíková Finančné deriváty, FMFI UK Bratislava

Zodpovedný prístup k rizikám hormonálnej substitučnej liečby a antikoncepcie

Pacientská organizácia pre chronické pľúcne choroby Tuberkulóza informácie pre pacientov

STRUČNÝ NÁVOD KU IP-COACHU

Zvýšenie kvality......

Microsoft Word - Transparencies03.doc

Nové odporúčania ESC na diagnostiku a liečbu periférnych artériových ochorení

8 Cvičenie 1.1 Dokážte, že pre ľubovoľné body X, Y, Z platí X + Y Z = Z + Y X. 1.2 Dokážte, že pre ľubovoľné body A, B, D, E, F, G afinného priestoru

Matematický model činnosti sekvenčného obvodu 7 MATEMATICKÝ MODEL ČINNOSTI SEKVENČNÉHO OBVODU Konečný automat predstavuje matematický model sekvenčnéh

STRUČNÝ NÁVOD KU IP-COACHU

Činnosť ambulancií pneumológie a ftizeológie v SR 2014

ZBIERKA ZÁKONOV SLOVENSKEJ REPUBLIKY Ročník 2016 Vyhlásené: Časová verzia predpisu účinná od: Obsah dokumentu je právne záväzný

Optimal approximate designs for comparison with control in dose-escalation studies

POF_web

Aplikace matematiky- záverečná práca Juraj Bodík 28. septembra 2017 Definície Žena - objekt ohodnotený celým číslom. Každé dve ženy sa dajú porovnat a

Microsoft Word - Argumentation_presentation.doc

Analýza hlavných komponentov

V súvislosti s týmto podujatím nemám žiaden konflikt záujmov.

1 Portál pre odborné publikovanie ISSN Heuristický adaptívny PSD regulátor založený na miere kmitavosti Šlezárová Alexandra Elektrotechnika

MINISTERSTVO ZDRAVOTNÍCTVA SLOVENSKEJ REPUBLIKY C (MZ SR) 5-01 ROČNÝ VÝKAZ O ČINNOSTI ALGEZIOLÓGIE za rok 2019 Registrované ŠÚ SR Č. Vk. 960/19 z 5.9.

Vybrané kapitoly zo štatistickej fyziky - domáce úlohy Michal Koval 19. mája 2015 Domáca úloha č. 1 (pochádza z: [3]) Systém pozos

Exaktné testy a konfidencné oblasti pre parametre normálneho lineárneho modelu s dvomi variancnými komponentami

Lokalizácia Peter Markoš Fyzikálny ústav SAV Katedra fyziky FEI STU Abstract Pri nízkych teplotách sa elektróny správajú ako kvantové častice. Preto s

Zmysel života v kontexte zvládania onkologického ochorenia

Využitie moderných meracích technológií na hodnotenie kvality tlače

Základné informácie k papierovej forme testovania žiakov 5. ročníka ZŠ T September 2016 NÚCEM, Bratislava 2016

Metrické konštrukcie elipsy Soňa Kudličková, Alžbeta Mackovová Elipsu, ako regulárnu kužeľosečku, môžeme študovať synteticky (konštrukcie bodov elipsy

Snímka 1

ZabezpeĊenie protiepidemických opatrení v súvislosti s pandémiou chrípky

Detekcia akustických udalostí v bezpečnostných aplikáciách

9.1 MOMENTY ZOTRVACNOSTI \(KVADRATICKÉ MOMENTY\) A DEVIACNÝ MOMENT PRIEREZU

Algoritmizácia a programovanie - Príkazy

Pocítacové modelovanie - Šírenie vln v nehomogénnom prostredí - FDTD

Operačná analýza 2

MINISTERSTVO ZDRAVOTNÍCTVA SLOVENSKEJ REPUBLIKY A (MZ SR) 2-01 ROČNÝ VÝKAZ O ČINNOSTI DIABETOLOGICKEJ AMBULANCIE za rok 2016 Registrované ŠÚ SR Č. Vk.

Microsoft Word - 6 Výrazy a vzorce.doc

Informačné technológie

Monday 25 th February, 2013, 11:54 Rozmerová analýza M. Gintner 1.1 Rozmerová analýza ako a prečo to funguje Skúsenost nás učí, že náš svet je poznate

Snímka 1

Operačná analýza 1-00

Štruktúra Modelu Výsledky odhadu Záver Trh práce v krajinách strednej Európy: Small Search and Matching Model Martin Železník Národná Banka Slovenska

Snímka 1

O možnosti riešenia deformácie zemského povrchu z pohladu metódy konecných prvkov konference pro studenty matematiky

VZTAH STUDENTŮ VŠ K DISCIPLÍNÁM TEORETICKÉ INFORMATIKY

5-Krizanova.ppt [Compatibility Mode]

Microsoft PowerPoint - Paschenov zakon [Read-Only] [Compatibility Mode]

Modelovanie nového produktu na trhu: Bassov model Beáta Stehlíková Cvičenia z časových radov, FMFI UK Modelovanie nového produktu na trhu: Bassov mode

Priebeh funkcie

Eva Janitorová

7/1/2015 Úvod do databáz, skúškový test, max 25 bodov, 90 min

Regresné modely pre nespojité veliciny

Dopyt po vzdelaní

Zvýšenie kvality......

Činnosť ambulancií pneumológie a ftizeológie v SR 2016

Prezentácia programu PowerPoint

Snímka 1

Funkcie viac premenných

Prepis:

Aké otázky v analýze prežívania riešime? Príklady z praxe Analýza prežívania (Survival analysis) Handout ku prednáškam Stanislav Katina 1 1 Ústav matematiky a statistiky Přírodovědecká fakulta Masarykova univerzita Odhadujeme a interpretujeme funkciu prežívania a riziko Porovnávame funkcie prežívania a riziká Charakterizujeme čas prežívania Modelujeme vzt ah medzi vysvetl ujúcimi premennými a časom prežívania jarný semester 016 Verzia 1. júna 016 1/ 149 Stanislav Katina Analýza prežívania (Survival analysis) / 149 Stanislav Katina Analýza prežívania (Survival analysis) Otázky v analýze prežívania v aplikáciách Príklady infarkt myokardu Prežívanie pacientov po infarkte myokardu (IM) v rámci sekundárnej prevencie závažných kardiovaskulárnych problémov u pacientov s polymorfizmom glykoproteínu IV (GP VI 1354C/T ) v membráne krvných doštičiek. [Thrombosis Research 15, : 61 4, 009] 105 pacientov sledovaných v priemere 19 (±10.8) mesiacov 3/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Otázky v analýze prežívania v aplikáciách Príklady infarkt myokardu Zlyhania: smrt, d alší IM, d alšia selektívna koronarografia (SKG: percutaneous coronary intervention (PCI, coronary angioplasty), coronary artery bypass graft (CABG)), d alša cievna mozgová príhoda (CMP; stroke), d alšia hospitalizácia (re-intervencia); sledované kombinácie: smrt /IM/re-intervencia a smrt /IM/re-intervencia/CMP [MACE; Major Adverse Cardiac Events, hlavné nepriaznivé srdcové udalosti] Adjustujúce(rizikové) premenné: 1 pohlavie (žena=0, muž=1) hypertenzia (nie=0, áno=1) 3 hyperlipidémia (nie=0, áno=1) 4 fajčenie (nefajčiar=0, fajčiar a bývalý fajčiar=1) 5 diabetes (nie=0, áno=1) 6 srdcové zlyhanie (NYHA; New York Heart Association; Classes: I = 0; II, III, IV = 1) 4/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Otázky v analýze prežívania v aplikáciách Príklady ortopédia. slovenský artroplastický register Otázky v analýze prežívania v aplikáciách Príklady ortopédia. slovenský artroplastický register Analýza prežívania implantátov bedra a kolena na Slovensku v rokoch 003 011. [Acta Chir. Orthop. Traum. Čech. 80: 1 85, 013] 49 668 operácií (primárnych operácií a revízií) zo všetkých slovenských ortopedických kliník za roky 003 011: 38 485 THA (Total Hip Arthroplasty) 11 183 TKA (Total Knee Arthroplasty) 5/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 6/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Otázky v analýze prežívania v aplikáciách Príklady ortopédia. slovenský artroplastický register Otázky v analýze prežívania v aplikáciách Príklady chronická myeloidná leukémia Zlyhania: zlyhanie komponentu implantátu Adjustujúce(rizikové, prognostické) premenné: 1 typ komponentu (acetabulárny=0, femorálny=1) fixácia komponentu (necementovaný=0, cementovaný=0) 3 pohlavie (žena=0, muž=1) 4 cementovacia technika (necementovaný=0, generácia cementu I = 1, generácia cementu II =, generácia cementu III = 3) 5 diagnóza pri primárnej operácii (primárna coxartróza = 1, dysplastická coxartróza =, poúrazová coxartróza = 3, aseptická nekróza hlavy = 4, M.Perthes = 5, reumatoidná artritída = 6, zlomenina krčku = 7) 6 dôvod revízie (spolu 18 dôvodov) 7 revidované časti (spolu 19 častí) a pod. Prežívanie pacientov s chronickou myeloidnou leukémiou (CML). [Neoplasma, 9, 5: 381 7, 005] 589 pacientov s CML, z ktorých 78 absolvovalo transplantáciu krvotvorných kmeňových buniek kostnej drene (allogeneic transplantation; transplantácia od HLA-identického súrodenca alebo nepríbuzného darcu; HLA znamená human leukocyte antigen) a zároveň majú odobrané vzorky periférnej krvi a kostnej drene pred a po transplantácii na Katedre genetiky Národného onkologického ústavu v Bratislave v rokoch 1990 až 00 7/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 8/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Otázky v analýze prežívania v aplikáciách Príklady chronická myeloidná leukémia Klasický prístup vs. analýza prežívania Príklady akútna myelogénna leukémia Zlyhania: úmrtie pacienta Adjustujúce(prognostické, rizikové) premenné: 1 vek pacienta v čase transplantácie (skupina 1: <0 rokov, skupina : [0,40), skupina 3: 40) fáza CML (spolu dve fázy; prvá chronická fáza = 1, d alšie chronické fázy = ) 3 pohlavie darcu a príjemcu (m m, m ž, ž m, ž ž) 4 čas od diagnózy po transplantáciu (< 1 rok, 1 rok) Example Akútna myelogénna leukémia (acute myelogenous leukemia, AML). Po absolvovaní chemoterapie a zmiernení príznakov, boli pacienti náhodne rozdelení do dvoch skupín. Prvá skupina (skupina A) dostala udržujúcu chemoterapiu a druhá (kontrolná; skupina B) nie. Ciel om bolo zistit, či udržujúca chemoterapia predlžuje čas do remisie (opätovného zhoršenia stavu). 9/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 10/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Klasický prístup vs. analýza prežívania Príklady akútna myelogénna leukémia Klasický prístup vs. analýza prežívania Tri náhl ady na problém analýzy AML dát Sk čas po kompletnú remisiu (v týždňoch) n udalostí cenzúr A 9,13,13+,18,3,8+,31,34,45+,48,161+ 11 7 4 B 5,5,8,8,1,16+,3,7,30,33,43,45 1 11 1 (číslo = čas do zlyhania, číslo a plus (+) = čas do cenzúry) 1 problém 1: po odstránení cenzúrovaných pozorovaní problém : po ošetrení cenzúrovaných pozorovaní, ktoré zoberieme do úvahy akoby boli udalost ami (zlyhaniami) 3 problém 3: berúc do úvahy cenzúrované pozorovania 11/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 1/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Klasický prístup vs. analýza prežívania Tri náhl ady na problém analýzy AML dát Klasický prístup vs. analýza prežívania Príklady cystická fibróza problém 1 problém problém 3 A B A B A B x 5.1 1.7 38.5 1.3 5.6.7 x 3.0 3.0 8.0 19.5 31.0 3.0 (čísla sú v týždňoch) Example Cystická fibróza(cf) je autozomálne genetické ochorenie spôsobené mutáciou génu pre CFTR (cystic fibrosis transmembrane conductance regulator). Postihuje prevažne pl úca, ale aj pankreas, pečeň a črevo. V celoslovenskej databáze pacientov CF rozlišujeme pacientov s jasnou klinickou formou (typická forma, 59 živých, 11 zomrelých) a pacientov s atypickou formu (188 živých). Spolu teda 559 pacientov, 447 živých a 11 zomrelých. Aký je priemerný vek (prežívania) a medián (prežívania) v rokoch? 13/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 14/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Klasický prístup vs. analýza prežívania Príklady cystická fibróza Klasický prístup vs. analýza prežívania Príklady cystická fibróza skupina/počty typická forma CF atypická forma CF spolu živí 59 188 447 zomrelí 11 0 11 spolu 371 188 559 problém 1 problém 3 typická CF typická CF x 9. 45.05 x 4.90 5.6 (čísla sú v rokoch) rozdiel problému 1 a rozdiel medzi priemerným vekom prežívania pacientov s typickou formou CF a priemerným vekom úmrtia je 35.83 roka (podobne pre medián je tento rozdiel 47.36 roka) problém 1 empirický 95%ISWaldovhotypupre strednú hodnotu veku úmrtia je (7.0, 11.41) a pre medián veku úmrtia (.7, 7.08) 15/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 16/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Klasický prístup vs. analýza prežívania Príklady cystická fibróza Klasický prístup vs. analýza prežívania Príklady cystická fibróza priemerný vek prežívania pre všetkých pacientov bez rozdielu typu CF je 53.94 ±.10 rokov, kdeempirický 95% IS Waldovho typu pre strednú hodnotu veku prežívania je rovný (49.8, 58.06) medián prežívania pre všetkých pacientov bez rozdielu typu CF je 70.8 roka;empirický 95%ISWaldovhotypu pre mediánu prežívania zatial nie je možné vypočítat priemerný vek prežívania pre pacientov s typickou formou CF je 45.05 ±.47 rokov, kdeempirický 95%IS Waldovho typu pre strednú hodnotu veku prežívania je (40.1, 49.89) medián prežívania je 5.6 roka, dolná hranica empirického 95% IS Waldovho typu pre medián prežívania je 36.43 roka; hornú hranicu IS pre medián zatial nie je možné vypočítat 17/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 18/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Klasický prístup vs. analýza prežívania Príklady cystická fibróza Klasický prístup vs. analýza prežívania Príklady cystická fibróza Tabul ka: Početnosti zomrelých v pät ročných vekových intervaloch (n = 11). Označenia: vekové intervaly (zdola je interval otvorený a zhora uzavretý, okrem prvého, ktorý je aj zdola uzavretý): I 1 = 0,5, I = (5,10, I 3 = (10,15, I 4 = (15,0, I 5 = (0,5, I 6 = 5,max(vek). vekové intervaly I 1 I I 3 I 4 I 5 I 6 početnosti 56 11 16 13 11 5 percentá 50% 9.8% 14.9% 11.61% 9.8% 4.46% 19/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 0/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Klasický prístup vs. analýza prežívania Príklady cystická fibróza Udalost Úvodné definície Udalost : ukončenie pozorovania z dôvodu zlyhania alebo smrti pacienta do konca sledovaného obdobia Ďalšie možné otázky Zlyhanie: smrt Adjustujúce(prognostické) premenné: antropologické ukazovatele, funkčné charakteristiky pl úc a pod. 1/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Príklady udalostí: overall survival smrt z akéhokol vek dôvodu progression-free survival prvé znaky progresie choroby alebo smrt disease-free survival prvé znovuobjavenie sa choroby alebo smrt event-free survival prvé znovuobjavenie sa choroby, objavenie sa inej špecifikovanej choroby alebo smrt disease-specific survival (cause-specific survival) smrt ako dôsledok špecifikovanej choroby relapse-free survival (recurrence-free survival) prvé znaky recidívy (opakovania sa) chodoby time-to-progression prvé znaky progresie choroby / 149 Stanislav Katina Analýza prežívania (Survival analysis) Cenúrovanie Úvodné definície Cenzúra: ukončenie pozorovania z dôvodu iného ako je zlyhanie alebo smrt pacienta do konca sledovaného obdobia dôjde k úmrtiu len niektorých pacientov, zatial čo u ostatných k úmrtiu do konca sledovaného obdobia bud nedôjde alebo sa títo pacienti z pozorovania stratia Príklady cenúr: ukončenie štúdie(termination of the study): pacient prežije časový interval experimentu konkurenčné riziko(competing risk): pacient zomrie z iného dôvodu, ako v dôsledku sledovanej choroby prerušenie/vysadenie liečby(drop-out): pacient preruší liečbu a odíde z kliniky predčasne, napr. z dôvodu zlých vedl ajších účinkov liečby, pacient sa sám rozhodne nepokračovat v liečbe strata z d alšieho sledovania(loss to follow-up): pacient sa rozhodne prest ahovat a nemáme o ňom už žiadne informácie 3/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Cenúrovanie Cenzúrovanie I. typu Základné princípy: 1 predpoklad všetkých n jedincov vstupuje do experimentu súčasne príčina cenzúrovania plánované ukončenie experimentu 3 ide ocenzúrovaniečasom zvolíme pevné číslo t c, ktoré nazveme fixovaný cenzurujúci čas 4 T (1) < T () <... < T (d), kde T (d) < t c < T (d+1) 5 náhodná veličina počet skutočne pozorovaných zlyhaní d {0,1,..., n} 6 nech X 1, X,..., X n, kde { Ti, T X i = min (T i, t c) = i t c, pre necenzúrované X i t c, T i > t c, pre cenzúrované X i 7 skutočnému pozorovaniu potom zodpovedá náhodný vektor (X i, δ i ) T, kde { 1, Ti t c, pre necenzúrované X δ i = i 0, T i > t c, pre cenzúrované X i 4/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Cenúrovanie Cenzúrovanie II. typu Základné princípy: 1 predpoklad všetkých n jedincov vstupuje do experimentu súčasne príčina cenzúrovania plánované ukončenie experimentu 3 ide o cenzúrovanie zlyhaním zvolíme si pevné číslo d, ktoré nazveme fixovaný počet zlyhaní; ukončenie teda nastáva po vopred zvolenom počte d zlyhaní, kde d = [np] +1, p (0,1) 4 X 1 = T (1), X = T (),..., X d = T (d), X d+1 = T (d),... X n = T (d) 5 náhodnáveličina čas trvania experimentu T (d) 6 nech X 1, X,..., X n, kde { X i = min(t i, T (d) Ti, T ) = i T (d), pre necenzúrované X i T (d), T i > T (d), pre cenzúrované X i 7 skutočnému pozorovaniu potom zodpovedá náhodný vektor (X i, δ i ) T, kde { 1, Ti T (d), pre necenzúrované X δ i = i 0, T i > T (d), pre cenzúrované X i Cenúrovanie Progresívne (zrýchlené) cenzúrovanie I. typu Základné princípy: 1 predpoklad všetkých n jedincov vstupuje do experimentu súčasne príčina cenzúrovania plánované ukončenie experimentu 3 ide ocenzúrovaniečasom zvolíme čísla t ci, i = 1,,..., k, ktoré nazveme fixované cenzurujúce časy, v čase t ci vyradíme m i subjektov 4 t c1 < t c <... < t ck 5 v čase t c1 vyradíme m 1 subjektov, v čase t c vyradíme m subjektov,..., v čase t ck vyradíme m k subjektov 6 po k-tom kroku máme vyradených m 1 + m +... + m k subjektov 7 náhodná veličina počet skutočne pozorovaných zlyhaní D {0,1,..., n} 5/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 6/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Cenúrovanie Progresívne (zrýchlené) cenzúrovanie II. typu Základné princípy: 1 predpoklad všetkých n jedincov vstupuje do experimentu súčasne príčina cenzúrovania plánované ukončenie experimentu 3 ide ocenzúrovaniezlyhaním zvolíme čísla d i, ktoré nazveme fixované počty zlyhaní; vyradenie teda nastáva po vopred zvolenom počte d i zlyhaní, kde d i = [np i ] +1, p i (0,1) 4 po d 1 zlyhaniach vyradíme m 1 subjektov, po d zlyhaniach vyradíme m subjektov,..., po d k zlyhaniach vyradíme m k subjektov 5 po k-tom kroku máme vyradených m 1 + m +... + m k subjektov 6 náhodnáveličina čas trvania experimentu T (d k ) Cenúrovanie Náhodné a l ubovol né cenzúrovanie Základné princípy: 1 predpoklad n jedincov nevstupuje do experimentu súčasne časdozlyhania T 1, T,..., T n sú nezávislé, rovnako rozdelené náhodné premenné, kde náhodná veličina T i (i = 1,..., n) má hustotu f(t) a distribučnú funkciu F (t) 3 časdocenzúrovania C 1, C,..., C n sú nezávislé, rovnako rozdelené náhodné premenné, kde náhodná veličina C i (i = 1,..., n) má hustotu g(t) a distribučnú funkciu G (t) 4 nech X 1, X,..., X n, kde { Ti, T X i = min(t i, C i ) = i C i, pre necenzúrované X i C i, T i > C i, pre cenzúrované X i 5 skutočnému pozorovaniu potom zodpovedá náhodný vektor (X i, δ i ) T, kde X i = min(t i, C i ) a { 1, Ti C δ i = i, pre necenzúrované X 0, T i > C i, pre cenzúrované X 6 náhodná veličina čas trvania experimentu a čas do cenzúry (ak C i = c, ide ol ubovol nécenzúrovanie) 7/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 8/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Cenúrovanie Intervalové cenzúrovanie I. typu Základné princípy: Majme n subjektov. Nech časy do zlyhania T i, i = 1,,..., n, sú náhodné premenné, ktorých realizácie nedokážeme pozorovat. Skutočnému pozorovaniu potom zodpovedá náhodný vektor (X i, δ i ) T, kde X i = C i sú časy cenzúr a δ i = I(T i C i ), t.j. { 1, Ti C δ i = i, pre necenzúrované X i 0, T i > C i, pre cenzúrované X i Example (nádor pl úc, animálny model) Laboratórne myši sú injektované látkou, ktorá spôsobuje nádor. Kedže tento druh nádoru nie je smrtel ný, je potrebné myš najprv zabit, aby sme zistili, či bol nádor indukovaný, t.j. po časovom úseku náhodnej dĺžky C je myš zabitá, aby sme zistili, či sa nádor vyvinul alebo nie.endpointzáujmu je čas T do objavenia sa nádoru. Cenúrovanie Intervalové cenzúrovanie II. typu Základné princípy: Majme opät n subjektov. Nech časy do zlyhania T i, i = 1,,..., nú náhodné premenné, ktorých realizácienedokážemepozorovat. Vieme len, že T i nastalo bud vnútri nejakého náhodného časového intervalu, pred jeho l avou hranicou alebo po jeho pravej hranici. Označme C i1 a C i časy dvoch vyšetrení a indikačné funkcie definujeme nasledovne δ i1 = I(T i C i1 ), δ i = I(C i1 < T i C i ) a δ i3 = I(T i > C i ), t.j. { 1, Ti C δ i1 = i1, pre necenzúrované X i, 0, T i > C i1, pre cenzúrované X i { 1, Ci1 < T δ i = i C i, pre necenzúrované X i 0, T i > C i, pre cenzúrované X i a nakoniec δ i3 = 0. Example (nádor pl úc, pacienti) Pacienti navštevovali kliniku opakovane každých 4 až 6 mesiacov, kde pozorovania sú bud intervaly (C i1, C i ak sa retrakcia prsníka vyskytla medzi poslednými dvoma návštevami alebo (C i, ), ak sa do C i retrakcia nevyskytla. 9/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 30/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Cenúrovanie Intervalové cenzúrovanie II. typu Základné princípy: Máme nasledovné tri možnosti: 1 udalost mohla nastat niekedy pred prvým vyšetrením C i1, kde δ i1 = 1 a δ i = δ i3 = 0, udalost mohla nastat niekedy medzi prvým a druhým vyšetrením, t.j. v intervale (C i1, C i, kde δ i1 = 0, δ i = 1 a δ i3 = 0, 3 udalost sa do druhého vyšetrenia nevyskytla, t.j. mohla nastat niekedy po C i (ale nevieme kedy), kde δ i1 = 0, δ i = 0 a δ i3 = 0. Nech X i1 = C i1 a X i = C i. Skutočnému pozorovaniu potom zopovedá náhodný vektor (X i1, X i, δ i1, δ i ) T. Všimnime si, že δ i3 nie je potrebné použit, pretože nemáme d alšie vyšetrenie po C i. Keby sme mali C i3 alebo aj d alšie (po ňom nasledujúce) vyšetrenia, hovorili by sme zovšeobecnenom intervalovom cenzúrovaní. Základné charakteristiky prežívania Názvoslovie, označenia, vzorce Nech T je nezáporná náhodná premenná (T 0) reprezentujúca čas úmrtia (zlyhania) indivídua z homogénnej populácie. Rozdelenie pravdepodobnosti T môže byt charakterizované rôznym spôsobom. V analýze prežívania sa najčastejšie používajú: 1 distribučná funkcia (distribution function) F(t) funkcia hustoty (hustota; probability density function) f(t) 3 funkcia prežívania (survivor function, reliability function) S(t) 4 riziková funkcia (funkcia rizika, intenzita úmrtnosti, riziko; hazard function, hazard rate, risk, mortality rate) λ(t), v poistných aplikáciách µ(t) 5 kumulatívna riziková funkcia (funkcia kumulatívneho rizika, kumulatívne riziko; cumulative hazard function) Λ(t) 31/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 3/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Základné charakteristiky prežívania Názvoslovie, označenia, vzorce Základné charakteristiky prežívania Názvoslovie, označenia, vzorce spojitý prípad Distribučná funkcia Ďalej sa budeme zaoberat charakteristikami: 1 p-tykvantil t p rozdelenia T, špeciálnemediánčasu prežívania (median survival time, median survival) t 0.5 mediánfunkcieprežívania S(t 0.5 ) 3 stredná hodnota času prežívania (mean survival) µ 4 stredná hodnota zostatkového života v čase t (mean residual life) mrl(t) 5 medián zostatkového života v čase t (median remaining lifetime, median residual life) mrlt(t) Funkcia hustoty F (t) = Pr (T t) = f (t) = Funkcia prežívania t 0 f (x) dx = 1 S (t) F (t) = F (t + t) F (t) t = (1 S (t)) = S (t) S (t + t) t S(t) = 1 F (t) = Pr (T > t) = t f(x)dx 33/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 34/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Základné charakteristiky prežívania Názvoslovie, označenia, vzorce spojitý prípad Základné charakteristiky prežívania Názvoslovie, označenia, vzorce spojitý prípad Riziková funkcia λ (t) = f (t) S (t) = t S (t) = ln S (t) S (t) t Kumulatívna riziková funkcia Λ(t) = t 0 λ (x) dx = ln S (t) ( ln S (0)) = ln S (t) Funkcia prežívania vyjadrená pomocou rizika a kumulatívneho rizika S (t) = e t 0 λ(s)ds = e Λ(t) Stredná hodnota času prežívania µ = 0 S (t) dt a často aj µ = tmax 0 S (t) dt Stredná hodnota zostatkového života v čase t t (u t)f(u)du t S(u)du mrl(t) = E[T t T > t] = = S(t) S(t) 35/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 36/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Základné charakteristiky prežívania Názvoslovie, označenia, vzorce spojitý prípad Funkcia prežívania vyjadrená pomocou mrl(t) S(t) = mrl(0) ( t mrl(t) exp 0 ) du mrl(u) Funkcia rizika vyjadrená pomocou mrl(t) ( ) 1 λ(t) = t mrl(t) + 1 mrl(t) Funkcia hustoty vyjadrená pomocou mrl(t) f(t) = ( ) ( mrl(0) t t mrl(t) + 1 (mrl(t)) exp 0 ) du mrl(u) Základné charakteristiky prežívania Názvoslovie, označenia, vzorce diskrétny prípad Funkcia prežívania S (t) = (1 λ (t i )), Funkcia hustoty f (t) = i 1 ( ( )) λ (t i ) 1 λ tj Kumulatívne riziko j=1 Λ(t) = ln (1 λ (t i )) Ak λ (t i ) sú malé, potom ln (1 λ (t i )) λ (t i ) a naviac Λ(t) = λ (t i ) 37 / 149 Stanislav Katina Analýza prežívania (Survival analysis) 38 / 149 Stanislav Katina Analýza prežívania (Survival analysis) Základné charakteristiky prežívania Názvoslovie, označenia, vzorce diskrétny prípad Stredná hodnota času prežívania µ = I I 1 (t i t i 1 )S(t i 1 ) = t i+1 (S(t i ) S(t i+1 )), kde t 0 = 0 a I n je počet rôznych zlyhaní; ak t max < c max, kde c max je maximálnym časom do cenzúry, potom strednú hodnotu počítame na intervale 0,c max i=0 Stredná hodnota zostatkového života v čase t kde t i t < t i+1 mrl(t) = (t i+1 t)s(t i ) + j i+1 (t j+1 t j )S(t j ), S(t) Funkcia vierohodnosti Pravé typy cenzúrovania Funkcia vierohodnosti pre jednotlivé typy cenzúrovania cenzúrovanie I. typu L = cenzúrovanie II. typu L = n f(x i ) δ i S f (t c ) 1 δ i n! (n d)! f(t (1))f(t () )...f(t (d) ) S f (t (d) ) n d náhodné cenzúrovanie L = n f(x i ) δ i S f (x i ) 1 δ i = n λ(x i ) δ i S f (x i ) 39 / 149 Stanislav Katina Analýza prežívania (Survival analysis) 40 / 149 Stanislav Katina Analýza prežívania (Survival analysis)

Funkcia vierohodnosti Pravé typy cenzúrovania Funkcia vierohodnosti Pravé typy cenzúrovania intervalové cenzúrovanie I. typu n L = [S f (x i )] 1 δ i [F(x i )] δ i intervalové cenzúrovanie II. typu n L = [F(x i1 )] δ i1 [F(x i ) F(x i1 )] δ i [S f (x i )] δ i3, kde δ i3 = 1 δ i1 δ i Náhodné cenzúrovanie L = = = = n f(x i ) δ i S f (x i ) 1 δ i = I [f(t i )] d i I n c [f(t i )] d i I [ S(tj ) ] n j n j+1 d j j=1 I [S(t i 1 )λ(t i )] d i n i n i+1 d i j=1 I [ S(tj ) ] n j n j+1 d j =... j=1 I [λ(t i )] d i [1 λ(t i )] n i d i S f (c ij ) 41 / 149 Stanislav Katina Analýza prežívania (Survival analysis) 4 / 149 Stanislav Katina Analýza prežívania (Survival analysis) Prehl ad vzorcov Charakteristiky definované sčítacím procesom Vo formuláciách sčítacím procesom (X i,δ i ) T nahradíme (N i (t),y i (t)), kde N i (t) je počet pozorovaných udalostí v intervale 0,t v jednotke i, { 1 jednotka i je v riziku v čase t (pozorujem ju) Y i (t) =. 0 inak Táto formulácia obsahuje dáta s pravým typom cenzúr ako špeciálny prípad, teda Y i (t) = I ({T i > t}) a N i (t) = I ({T i t, δ = 1}). Všimnime si, že N (t) je zprava spojitá a Y (t) zl ava spojitá. Y (t) je príkladom predikovatel ného procesu, ktorého hodnoty v čase t sú známe nekonečne krátko pred t, v čase t, ak nie skôr. Sčítací proces je stochastický proces začínajúci v čase 0, ktorého trajektória je zprava spojitá funkcia so skokmi vel kosti 1. Pre N (t) potom platí {N (t) : t 0}, N (0) = 0. Prehl ad vzorcov Charakteristiky definované sčítacím procesom Odhad kumulatívneho rizika je definovaný na základe agregovaného procesu Y (t) = i Y i (t), N (t) = i N i (t), dn (t) = N (t) = N (t) N (t ), kde N (t) je suma udalostí do času t vrátane, Y (t) je počet jednotiek v riziku v čase t (formálne ide o počet jednotiek v riziku v časovom intervale (t ǫ, t pre malé ǫ). Example Majme náhodný vektor (X i,δ i ), definovaný nasledovne (pre nejaku fiktívnu i-tu štatistickú jednotku, t.j. subjekt) Riešenie 1) (X i,δ i ) T = (3, 0) T, t.j. v čase X i = 3 je cenzúra, N i (t) = N i (3) = 0, Y i (3) = Y i (3) = 1 (N i (3),Y i (3)) T = (0, 1) T, ) (X i,δ i ) T = (4, 1) T, t.j. v čase X i = 4 je udalost (zlyhanie), N i (4) = 1, Y i (4) = 1, t.j. (N i (4),Y i (4)) T = (1, 1) T, 3) Ak máme viac udalostí: (N i (0.5),Y i (0.5)) T = (1, 1) T, (N i (),Y i ()) T = (, 1) T. 43 / 149 Stanislav Katina Analýza prežívania (Survival analysis) 44 / 149 Stanislav Katina Analýza prežívania (Survival analysis)

Prehl ad vzorcov Odhady kumulatívneho rizika Prehl ad vzorcov Odhady kumulatívneho rizika Nelson-Aalenov (NA) odhad kumulatívneho rizika Λ NA (t) = t 0 dn (s) Y (s) ds N (t i ) Y (t i ) Flemingom a Harringtonom (FH) modifikovaný NA odhad kumulatívneho rizika Λ FHmodNA (t) = t 0 N(s) 1 j=0 N(t i ) 1 j=0 1 ds Y (s) j 1 Y (t i ) j Nelson-Aalenov (NA) odhad kumulatívneho rizika Λ NA (t) = λ (t i ) = d i n i, Flemingom a Harringtonom (FH) modifikovaný NA odhad kumulatívneho rizika Λ FHmodNA (t) = d i 1 1 n i j j=0 45 / 149 Stanislav Katina Analýza prežívania (Survival analysis) 46 / 149 Stanislav Katina Analýza prežívania (Survival analysis) Prehl ad vzorcov Odhady funkcie prežívania Prehl ad vzorcov Odhady funkcie prežívania Kaplan-Meierov odhad funkcie prežívania Ŝ KM (t) = Breslowov odhad funkcie prežívania ( ) Ŝ B (t) = exp Λ(t) = [ ] 1 Λ(t i ), Λ(t i ) = N (t i) Y (t i ) e Λ(t i ), Λ(t i ) = N (t i) Y (t i ) Flemingom a Harringtonom modifikovaný Breslowov odhad funkcie prežívania ( ) Ŝ FHmodB (t) = exp Λ FHmodNA (t) = e Λ FHmodNA (t i ) Kaplan-Meierov odhad funkcie prežívania Ŝ KM (t) = [ 1 d ] i = n ŜKMmod = i Breslowov odhad funkcie prežívania ( ) Ŝ B (t) = exp Λ NA (t) = e d i n i 1 d i 1 j=0 = e 1 n i j Flemingom a Harringtonom modifikovaný Breslowov odhad funkcie prežívania ( ) [ Ŝ FHmodB (t) = exp Λ FHmodNA (t) = e di 1 j=0 d i n i ] 1 n i j 47 / 149 Stanislav Katina Analýza prežívania (Survival analysis) 48 / 149 Stanislav Katina Analýza prežívania (Survival analysis)

Prehl ad vzorcov Odhady rozptylu kumulatívneho rizika Greenwoodov odhad rozptylu kumulatívneho rizika Var G [Λ(t) ] = ] t Var G [ ln ŜKM (t) = 0 NA odhad rozptylu kumulatívneho rizika t Var [ΛNA (t)] = 0 dn (s) [ Y (s) Y (s) dn (s) dn (s) Y ds (s) Flemingom a Harringtonom modifikovaný NA odhad rozptylu kumulatívneho rizika t N(s) 1 1 Var [ΛFHmodNA (t)] = [ ] ds 0 j=0 Y (s) j ]ds Prehl ad vzorcov Odhady rozptylu kumulatívneho rizika Greenwoodov odhad rozptylu kumulatívneho rizika ] Var G [Λ(t) = NA odhad rozptylu kumulatívneho rizika Var [ΛNA (t)] = N (t i ) [ ] Y (t i ) Y (t i ) N (t i ) N (t i ) Y (t i ) Flemingom a Harringtonom modifikovaný NA odhad rozptylu kumulatívneho rizika Var [ΛFHmodNA (t)] = N(t i ) 1 1 [ ] j=0 Y (t i ) j 49 / 149 Stanislav Katina Analýza prežívania (Survival analysis) 50 / 149 Stanislav Katina Analýza prežívania (Survival analysis) Prehl ad vzorcov Odhady rozptylu kumulatívneho rizika Greenwoodov odhad rozptylu kumulatívneho rizika ] Var G [Λ(t) = N (t i ) [ Y (t i ) Y (t i ) N (t i ) NA odhad rozptylu kumulatívneho rizika Var [ΛNA (t)] = d i n i ] = d i n i (n i d i ) Flemingom a Harringtonom modifikovaný NA odhad rozptylu kumulatívneho rizika Var [ΛFHmodNA (t)] = d i 1 1 (n i j) j=0 Prehl ad vzorcov Odhad strednej hodnoty a jeho rozptyl Odhad strednej hodnoty času do zlyhania E [T] (priemerný čas do zlyhania) v spojitom prípade je definovaný ako v diskrétnom prípade µ = µ = tmax 0 t max 1 Ŝ (t) dt, (t i+1 t i )Ŝ(t i), kde t 0 = 0 a I n je počet rôznych zlyhaní a t I = t max. i=0 Odhad rozptylu priemerného času do zlyhania je definovaný ako Var [µ] = tmax 0 [ tmax Ŝ (u) du] σ (t)dt t 51 / 149 Stanislav Katina Analýza prežívania (Survival analysis) 5 / 149 Stanislav Katina Analýza prežívania (Survival analysis)

Prehl ad vzorcov Odhad strednej hodnoty a jeho rozptyl Prehl ad vzorcov Odhad strednej hodnoty zostatkového života a jeho rozptyl a v diskrétnom prípade Var [µ] = max 1 j:t i t j t max 1 (t j+1 t j )Ŝ(t j) σ (t i ). Za Ŝ (t) dosadíme ŜKM (t), ŜB (t) alebo ŜFHmodB (t). Podobne ako pri rozptyle funkcie prežívania dostaneme pät nasledovných rozptylov Var G [µ KM ] = VarG [µ KMmod ], VarNA [µ B ], Var NA [µ FHmodB ] a VarG [µ FHmodB ]. VarAJ [µ KM ], Odhad strednej hodnoty zostatkového života (priemerný zostatkový život) v čase t je definovaný v spojitom prípade ako mrl(t) = tmax t a v diskrétnom prípade ako mrl(t) = 1 (t i+1 Ŝ(t) t)ŝ(t i) + Ŝ(u)du Ŝ(t) j:t i+1 t j t max 1 (t j+1 t j )Ŝ(t j), kde t i t < t i+1. Za Ŝ( ) dosadíme ŜKM( ), ŜB( ) alebo ŜFHmodB( ). 53 / 149 Stanislav Katina Analýza prežívania (Survival analysis) 54 / 149 Stanislav Katina Analýza prežívania (Survival analysis) Prehl ad vzorcov Odhad strednej hodnoty zostatkového života a jeho rozptyl Odhad rozptyl priemerného zostatkového života [ Var[ mrl(t)] 1 tmax tmax = Ŝ(x)dx] σ (u) du Ŝ (t) t u [ ] tmax ) t + Ŝ(u)du σ (u)du, t pre spojitý prípad, kde u t,t max, a pre diskrétny prípad Var[ mrl(t)] 1 = (t j+1 t j Ŝ (t) )Ŝ(t j) σ (t i ) + j:t t j t max 1 i:t t i t max 1 0 j:t i t j t max 1 (t j+1 t j )Ŝ(t j) σ (t i ). Prehl ad vzorcov Odhad strednej hodnoty zostatkového života a jeho rozptyl Za Ŝ (t) dosadíme ŜKM (t), ŜB (t) alebo ŜFHmodB (t). Potom dostaneme mrl KM (t), mrl B (t) a mrl FHmodB (t) pät nasledovných rozptylov Var G [ mrlkm ] = Var G [ mrlkmmod ], Var NA [ mrlb ], [ ] [ Var NA mrlfhmodb a Var G mrlfhmodb ]. Var AJ [ mrlkm ], 55 / 149 Stanislav Katina Analýza prežívania (Survival analysis) 56 / 149 Stanislav Katina Analýza prežívania (Survival analysis)

Prehl ad vzorcov Intervaly spol ahlivosti Prehl ad vzorcov Intervaly spol ahlivosti 1 Waldov princíp, skóre princíp a vierohodnostný princíp (všetky tri vychádzajúce z funkcie vierohodnosti), princíp transformácie funkcie vierohodnosti v S(t) pomocou nejakej funkcie g(s(t)) aplikovaný na Waldov princíp (hranice IS vypočítané pomocou g(s(t)) sa spätne transformujú do škály S(t)), kde podl a g(s(t)) rozoznávame nasledovné škály 3 princíp úpravy hraníc IS pomocou efektívneho rozsahu súboru v čase t (n (t) alebo n (t)) z dôvodu výskytu cenzúr v dátach (resp. rozdielu medzi rozptylom S(t) v čase t vypočítaným pre cenzúrované dáta a rozptylom za predpokladu, že cenzúry v dátach nie sú) 4 princíp korekcie hraníc IS z dôvodu zlých štatistických vlastností (konzervatívny alebo liberálny IS, t.j. predpokladáme, že nominálny koeficient spol ahlivosti 1 α je iný ako teoretický) g(s(t)) = S(t) škála funkcie prežívania g(s(t)) = ln S(t) škála logaritmu funkcie prežívania (log škála funkcie prežívania; škála kumulatívneho rizika) spätná transformácia pre funkciu prežívania exp(ln S(t)), g(s(t)) = ln( ln S(t)) = ln Λ(t) log-log škála funkcie prežívania (log škála kumulatívneho rizika; škála logaritmu kumulatívneho rizika) spätná transformácia exp(exp(ln ( ln S(t)))), ( g(s(t)) = arcsin (S(t)) 1/) arcus sínus škála funkcie ( ( prežívania spätná transformácia sin arcsin ((S(t)) 1/))) ( ( )) ( )) g(λ(t)) = arcsin exp = arcsin exp arcus Λ(t) ( ln S(t) sínus( škála ( kumulatívneho ( ( rizika )))) spätná transformácia ln sin arcsin exp Λ(t) 57/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 58 / 149 Stanislav Katina Analýza prežívania (Survival analysis) Softvérová implementácia charakteristík prežívania knižnica library(survival) surv.obj <- survfit(surv(cas,status) 1, type="...",error="...",conf.type ="...")) Argumenty: odhady funkcie prežívania vypočítame ako 1 Ŝ KM (t):type="kaplan-meier" (default) Ŝ B (t):type="fleming-harrington" 3 Ŝ FHmodB (t):type="fh" odhady rozptylu ako ] 1 Var G [ŜKM (t) :error="greenwood" (default) ] Var G [ŜB (t) :error="tsiatis" typy intervalov spol ahlivosti (IS) ako 1 žiadny: conf.type="none" škála funkcie prežívania: conf.type="plain" 3 škála kumulatívneho rizika:conf.type ="log" (default) 4 škála log. kumulatívneho rizika:conf.type="log-log" 59 / 149 Stanislav Katina Analýza prežívania (Survival analysis) Softvérová implementácia charakteristík prežívania knižnica library(survival) Ďalšími argumentami sú: koeficient spol ahlivosticonf.int=0.95 (default) úprava spodnej hranice IS, kde argument 1 conf.lower="usual" (nemodifikovaná dolná hranica IS) conf.lower="peto" (používa Petov efektívny rozsah súboru n (t)) 3 conf.lower="modified" (používa Dorey-Korn modifikáciu) Priemerný vek prežívania a jeho smerodajná odchýlka ako aj medián a jeho smerodajná odchýlka sa vypočítajú ako 1 print(surv.obj,print.rmean=true) alebo print(surv.obj, rmean="individual") 60 / 149 Stanislav Katina Analýza prežívania (Survival analysis)

Softvérová implementácia charakteristík prežívania knižnica library(survival) Softvérová implementácia charakteristík prežívania knižnica library(survival) Na rozlíšenie typu cenzúrovania je dôležitý počet argumentov funkcie Surv(). Ak sú dva, t.j. Surv(cas,status), ide o pravý typ cenzúrovania. Ak sú tri, t.j. Surv(cas,cas1, status), potom ide o intervalové cenzúrovanie. Pomocným argumentom je type="...", kde rozlišujeme 1 type="right" (pravý typ), type="interval" (intervalový typ cenzúrovania I. typu, kde interval (, t i označujeme (NA, t i ) type="interval" (intervalový typ cenzúrovania II. typu; kde interval je typu (t 1i, t i alebo interval (t i, ), ktorý označujeme (t i,na)) Dolnou hranicou intervalu môže byt aj 0 a hornou hranicou t max. Výstupmi objektu surv.obj a summary(surv.obj) sú nasledovné: 1 rozsah n počet jedincov v riziku v jednotlivých časoch n.risk 3 počet udalostí (zlyhaní) v jednotlivých časoch n.event 4 počet cenzúr v jednotlivých časoch n.censor 5 odhad funkcie prežívania v jednotlivých časoch surv 6 odhad odmocniny z rozptylu funkcie prežívania v jednotlivých časoch std.err 7 dolná hranica IS pre funkciu prežívania v jednotlivých časoch lower 8 horná hranica IS pre funkciu prežívania v jednotlivých časoch upper 9 časy, v ktorých nastalo zlyhanie alebo cenzúra time (pre surv.obj) zlyhanie time (pre summary(surv.obj)) 61/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 6/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Testy na porovnanie kriviek prežívania Prehl ad testov Testy na porovnanie kriviek prežívania Prehl ad testov Delenie testov na porovnanie kriviek prežívania typ dát: necenzúrované alebo cenzúrované počet porovnávaných kriviek prežívania: k = alebo k 3 typ pozorovaní: nepárové alebo párové typ alternatívy: všeobecná alebo zoradená crossing efekt (prekrižovanie sa kriviek prežívania): neexistuje alebo existuje časový efekt liečby: neexistuje alebo existuje Neparametrické testy porovnania kriviek prežívania pre necenzurované dáta testy porovnania dvoch kriviek prežívania (k = ) Wilcoxonov test (W) Mann-Whitney test (MW) Siegel-Tukey test (ST) testy porovnania viac kriviek prežívania (k 3) Kruskal-Wallis test (KW) Jonckheere test (J) Cuzick test (C) Le test (L) 63 / 149 Stanislav Katina Analýza prežívania (Survival analysis) 64/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Testy na porovnanie kriviek prežívania Prehl ad testov Testy na porovnanie kriviek prežívania Prehl ad testov Neparametrické testy porovnania kriviek prežívania pre cenzurované dáta testy porovnania dvoch kriviek prežívania (k = ) Gehan-Wilcoxon test, zovšeobecnený Wilcoxonov test (GW) Cox-Mantel test, log-rank test (CM) Tarone-Ware test (TW) Peto-Peto test (PP) testy porovnania viac kriviek prežívania (k 3) Gehan-Breslow test, zovšeobecnený Wilcoxonov test, zovšeobecnený Kruskal-Wallis test (GB) Cox-Mantel test, log-rank test (CM) Mantel-Haenszel test, log-rank test (MH) Peto-Peto test (PP) Testované hypotézy nulovná hypotéza H 0 : S 1 (t) = S (t) = S (t) alternatíva hypotéza H 1 : S 1 (t) S (t), pre t st S 1 S, čo je ekvivalentné s S 1 (t) < S (t), pre t st S 1 S, čo je ekvivalentné s S 1 (t) > S (t), pre t S (t) je funkcia prežívania st a st stochasticky menší, resp. stochasticky väčší 65/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 66/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Wilcoxonov test Predpoklady X 1,...,X n1 je náhodný výber (NV) z nejakého spojitého rozdelenia Y 1,...,Y n je NV z rovnakého spojitého rozdelenia a je oproti prvému rozdeleniu posunuté o nejakú konštantu δ veličiny X 1,...,X n1 a Y 1 δ,...,y n δ majú rovnaké rozdelenie oba výbery sú nezávislé Hypotézy H 0 : δ = 0 (S 1 (t) = S (t), t) H 1 : δ 0 (S 1 (t) S (t), pre aspoň jedno t) Wilcoxonov test Označenia n j je počet pozorovaní v j-tom NV, j = 1, n 1 + n = n nech R 1,R,..., R n1 sú poradia X 1,X,...,X n1 prvého NV v rámci usporiadaného združeného NV ich realizácie r 1,r,...,r n1 sú poradia realizácií x 1,x,...,x n1 Wilcoxonova štatistika n 1 W X = S W = Realizáciu S W ozn. w X = s W = n 1 r i. R i 67/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 68/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Wilcoxonov test Stredná hodnota a rozptyl S W : E 0 [S W ] = n 1 (n + 1) Var 0 [S W ] = n 1n (n + 1) 1 Wilcoxonova testovacia štatistika Ak n 1,n 10 Realizáciu Z W ozn. z W. Z W = S W E 0 [S W ] Var 0 [S W ] D N (0,1) Wilcoxonov test Stredná hodnota a rozptyl S W : E 0 [S W ] = n 1 (n + 1) Var 0 [S W t] = n 1n (n + 1) 1 1 Wilcoxonova testovacia štatistika Ak n 1,n 10 S Z W = W E 0 [S W ] Var 0 [S W ] Realizáciu Z W ozn. z W. 1 n (n 1) n ( ) 1n j tj 3 t j 1(n 1 +n )(n 1 +n 1) L j=1 ( ) t j tj 1 D N (0, 1) 69/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 70 / 149 Stanislav Katina Analýza prežívania (Survival analysis) Mann-Whitney test Mann-Whitney test Predpoklady X 1,...,X n1 je NV z nejakého spojitého rozdelenia Y 1,..., Y n je NV z rovnakého spojitého rozdelenia a je oproti prvému rozdeleniu posunuté o nejakú konštantu δ oba výbery sú nezávislé nech ( X i,y j ) sú možné páry pozorovaní, pre ktoré môže nastat bud X i < Y j alebo X i > Y j Hypotézy H 0 : δ = 0 (S 1 (t) = S (t), t) H 1 : δ > 0 (S 1 (t) < S (t), pre aspoň jedno t) Označenia n j je počet pozorovaní v j-tom NV, j = 1, n 1 + n = n Mann-Whitneyho štatistika n 1 n S MW = I(X i > Y j ) = # ( ) X i,y j, kde Xi > Y j j=1 Realizáciu S MW ozn. s MW = n 1 n j=1 I(x i > y j ). 71/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 7/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Mann-Whitney test Mann-Whitney vs Wilcoxonov test Stredná hodnota a rozptyl S MW : E 0 [S MW ] = n 1n Var 0 [S MW ] = Var 0 [S W ] = n 1n (n 1 + n + 1) 1 Mann-Whitneyho testovacia štatistika Ak n 1,n 10 Z MW = S MW E 0 [S MW ] Var 0 [S MW ] D N (0,1) U X vyjadruje počet dvojíc X i,y j, kde platí X i < Y j U X = n 1 n + n 1 (n 1 + 1) W X, U Y vyjadruje počet dvojíc X i,y j, kde platí X i > Y j U Y = n 1 n + n (n + 1) W Y Realizáciu Z MW ozn. z MW. 73/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 74/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Wilcoxonov a Mann-Whitneyho test Example (nádor pl úc; cvič.) Nech t ij,i = 1,...,n j,j = 1, sú časy do zlyhania (úmrtia) od diagnostiky nádoru pl úc v mesiacoch, kde j = 1 predstavuje I. typ terapie a j = zasa II. typ terapie (pozri tabul ku). Otestujte H 0 : S 1 (t) = S (t) oproti alternatíve H 1 : S 1 (t) S (t) pomocou S W a S MW nesledovne (1) S W = W Y a S W = W X, () S MW = U Y a S MW = U X. Vždy presne naformulujte H 1. Okomentujte výsledky. t ij 5 40 19 53 15 43 340 133 111 31 378 49 skup 1 1 1 1 1 1 1 75/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Wilcoxonov a Mann-Whitneyho test casy.zlyh <- c(5,40,19,53,15,43,340,133,111,31,378,49) skupina <- c(1,,,1,1,,,1,1,,1,1) n1 <- length(casy.zlyh[skupina == 1]) n <- length(casy.zlyh[skupina == ]) n <- n1+n N <- c(n1,n) Wilcoxonov test t (i) 15 19 43 49 5 53 111 133 31 40 340 378 skup 1 1 1 1 1 1 1 r (1) i 1 - - 4 5 6 7 8 - - - 1 r () i - 3 - - - - - 9 10 11 - s W = w Y = 5 r () = 35 i E 0 [S W ] = 5(7+5+1) = 3.5 a Var 0 [S W ] = 7 5(7+5+1) = 37.9 1 z W = (35 3.5)/6.158 = 0.406 a p-hodnota=0.685 R <- rank(casy.zlyh) Sw <- sum(r*(skupina == )) # 35 (s W ) E.Sw <- n*(n+1)/ # 3.5 (E 0 [S W ]) Var.Sw <- n1*n*(n+1)/1 # 37.91667 (Var 0 [S W ]) Zw <- (Sw-E.Sw)/sqrt(Var.Sw) # 0.405999 (z W ) *(1-pnorm(abs(Zw))) # 0.6847434 76/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Wilcoxonov a Mann-Whitneyho test s W = w X = 5 r (1) = 43; E i 0 [S W ] = 7(7+5+1) = 45.5; Var 0 [S W ] = 7 5(7+5+1) = 37.9; 1 z W = (43 45.5)/6.158 = 0.406; p-hodnota=0.685; R <- rank(casy.zlyh) Sw <- sum(r*(skupina == 1)) # 43 (s W ) E.Sw <- n*(n+1)/ # 45.5 (E 0 [S W ]) Var.Sw <- n1*n*(n+1)/1 # 37.91667 (Var 0 [S W ]) Zw <- (Sw-E.Sw)/sqrt(Var.Sw) # -0.405999 (z W ) p.val <- *(1-pnorm(abs(Zw))) # 0.6847434 Mann-Whitneyho test Smw <- n1*n-sum(r*(skupina == ))+n*(n+1)/ # 15 (s MW ) E.Smw <- n1*n/ # 17.5 (E 0 [S MN ]) Var.Smw <- n1*n*(n+1)/1 # 37.91667 (Var 0 [S MN ]) Zmw <- (Smw-E.Smw)/sqrt(Var.Smw) # -0.405999 (z W ) *(1-pnorm(abs(Zmw.))) # 0.6847434 Smw <- n1*n- sum(r*(skupina == 1))+n1*(n1+1)/ (s MW ) Zmw <- (Smw-E.Smw)/sqrt(Var.Smw) # 0.405999 (z MW ) p.val <- *(1-pnorm(abs(Zmw))) # 0.6847434 Wilcoxonov vs Mann-Whitneyho test Example (Wilcoxonov vs Mann-Whitneyho test; DÚ) Nech U X vyjadruje počet dvojíc X i,y j, kde platí X i < Y j, podobne U Y vyjadruje počet dvojíc X i,y j, kde platí X i > Y j. Dokážte, že U X = n 1 n + n 1 (n 1 + 1) W X,U Y = n 1 n + n (n + 1) Pozn.: Ekvivalentne sa dá ukázat, že W X = U Y + n 1(n 1 +1) (podobne pre W Y a U X ) a dosadit do vzorcov pre U X a U Y. W Y. 77/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 78/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Asymptotická normalita rozdelenia S MW Asymptotická normalita rozdelenia S MW Example (asymptotická normalita S MW ) Pre n 1 = 7 a n = 5 porovnajte v asymptotické rozdelenie S MW s jej exaktným rozdelením. Na výpočet asymptotickej hustoty použite funkciu dnorm() a na výpočet asymptotickej distribučnej funkcie použite funkcie dnorm() a cumsum(). Na výpočet exaktnej hustoty použite funkciu dwilcox() a na výpočet exaktnej distribučnej funkcie použite funkciu pwilcox(). Teoretické a exaktné rozdelenie superponujte v podobe (1) hustoty, () distribučnej funkcie a (3) qq-diagramu s qq-priamkou (na x-ovej osi bude sekvencia x od teoreticky možného min(s MW ) po teoreticky možné max(s MW ) a na y-ovej osi teoretické kvantily y vypočítané pomocou funkcie qnorm(); qq-priamka bude prechádzat bodmi ( x 0.5,ỹ 0.5 ) a ( x 0.75,ỹ 0.75 ). f(x) 0.00 0.01 0.0 0.03 0.04 0.05 0.06 Hustota MW statistiky 0 5 10 15 0 5 30 35 x n1=7,n=5 F(x) 0.0 0. 0.4 0.6 0.8 1.0 Distribucna funkcia MW statistiky 0 5 10 15 0 5 30 35 x n1=7,n=5 kvantily 0 10 0 30 qq diagram MW rozdelenia 0 10 0 30 40 x n1=7,n=5 Obr.: Rozdelenie Mann-Whitneyho štatistiky S MW (n 1 = 7,n = 5) Example (asymptotická normalita S MW ) Porovnajte v asymptotické rozdelenie S MW s jej exaktným rozdelením pre (1) n 1 = 5 a n = 50, () n 1 = 50 a n = 50, (3) n 1 = 50 a n = 100 a (4) n 1 = 100 a n = 100. 79/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 80/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Siegel-Tukey a Levene test Predpoklady liečba nespôsobuje zmenu priemernej odpovede, ale výsledná odpoved má menší rozptyl okolo strednej hodnoty X 1,..., X n1 je NV z nejakého spojitého rozdelenia Y 1,..., Y n je NV z nejakého spojitého rozdelenia oba výbery sú nezávislé Hypotézy H 0 : Var(S 1 (t)) = Var(S (t)), t H 1 : Var(S 1 (t)) Var(S (t)), pre aspoň jedno t 81/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Siegel-Tukey test Podstata Siegel-Tukey testu je nasledovná Algoritmus 1: poradie R 1 priradíme najmenšiemu pozorovaniu poradie R priradíme najväčšiemu pozorovaniu poradie R 3 priradíme druhému najmenšiemu pozorovaniu poradie R 4 priradíme druhému najväčšiemu pozorovaniu atd. Siegel-Tukey štatistika n 1 S ST = R i, kde daná suma prislúcha súčtu poradí pre prvý NV. Realizáciu S ST ozn. s ST = n 1 r i. 8/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Siegel-Tukey test Stredná hodnota a rozptyl S ST (resp. S alt ST ): [ ] E 0 [S ST ] = E 0 SST alt = n 1 (n 1 + n + 1) Var 0 [S ST ] = Var [ ] 0 S alt n 1 n (n 1 + n + 1) ST = 1 Siegel-Tukey testovacia štatistika Ak n 1,n 10 Z ST = ZST alt = S ST E 0 [S ST ] Var 0 [S ST ] Realizáciu Z ST = Z alt ST ozn. z ST = z alt ST. D N (0,1) Levene test Podstata Leveneho alternatívy ST testu (Levene testu) je nasledovná: odchýlky D X = X X a D Y = Y Y D (1) < D () <... < D (n),n = n 1 + n realizácie odchýlok {d i = x i x } n 1 a { d j = yj y } n j=1 d (1) < d () <... < d (n) Levene štatistika n 1 S L = SST alt = R diff,(i), kde R diff,(i) predstavujú poradia odchýlok od priemeru pre prvý NV. Realizáciu SST alt ozn. salt ST. 83/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 84 / 149 Stanislav Katina Analýza prežívania (Survival analysis)

Levene test Stredná hodnota a rozptyl S alt ST : [ ] E 0 [S ST ] = E 0 SST alt = n 1 (n 1 + n + 1) Var 0 [S ST ] = Var [ ] 0 S alt n 1 n (n 1 + n + 1) ST = 1 Levene testovacia štatistika Ak n 1,n 10 Z L = ZST alt = Salt ST E [ 0 S alt ST Var alt 0 [S ST] Realizáciu Z L = Z alt ST ozn. z L = z alt ST. ] D N (0,1) 85/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Siegel-Tukey test a Levene test Example (nádor pl úc pokrač., cvič.) Nech t ij,i = 1,...,n j,j = 1, sú časy do zlyhania (úmrtia) od diagnostiky nádoru pl úc v mesiacoch, kde j = 1 predstavuje I. typ terapie a j = zasa II. typ terapie (pozri tabul ku). Otestujte v H 0 : Var[S 1 (t)] = Var[S (t)] oproti alternatíve H 1 : Var[S 1 (t)] Var[S (t)] pomocou S ST a SST alt. Okomentujte výsledky. t ij 5 40 19 53 15 43 340 133 111 31 378 49 skup 1 1 1 1 1 1 1 R (1) i 9 - - 11 1 - - 10 1-7 R () i - 6 3 - - 5 4 - - 8 - - Siegel-Tukey test s ST = 5 r () = 6 i E 0 [S ST ] = 5(7+5+1) ; Var 0 [S W ] = 7 5(7+5+1) 1 Z ST = (6 3.5)/6.157651 = 3.167 a p-hodnota=0.91 86/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Siegel-Tukey test a Levene test Siegel-Tukey test a Levene test casy.zlyh.1 <- casy.zlyh Rst <- rep(0,n) for(i in 1:n) { if(i%%==1) Rst <- Rst+(min(casy.zlyh.1[casy.zlyh.1>0])== casy.zlyh.1)*i else Rst <- Rst+(max(casy.zlyh.1[casy.zlyh.1>0])==casy.zlyh.1)*i casy.zlyh.1 <- casy.zlyh.1*(rst==0) } Rst # 9 6 3 11 1 5 4 10 1 8 7 Sst <- sum(rst*(skupina==)) # 6 (s ST ) E.Sst <- n*(n+1)/ # 3.5 (E 0 [S ST ]) Var.Sst <- n1*n*(n+1)/1 # 37.91667 (Var 0 [S ST ]) Zst <- (Sst-E.Sst)/sqrt(Var.Sst) # -1.055597 (z ST ) p.val <- *(1-pnorm(abs(Zst))) # 0.9115 Sst <- sum(rst*(skupina==1)) # 5 (s ST ) E.Sst <- n1*(n+1)/ # 3.5 (E 0 [S ST ]) Zst <- (Sst-E.Sst)/sqrt(Var.Sst) # 1.055597 (z ST ) p.val <- *(1-pnorm(abs(Zst))) # 0.9115 Levene test priemer.1 <- mean(casy.zlyh[skupina == 1]) priemer. <- mean(casy.zlyh[skupina == ]) casy.zlyh. <- casy.zlyh for(i in 1:n){ if(skupina[i]==0) casy.zlyh.[i] <- abs(casy.zlyh[i] - priemer.1) else casy.zlyh.[i] <- abs(casy.zlyh[i] - priemer.) } Rl <- rank(casy.zlyh.) # 5 7 10 4 8 9 11 1 3 1 6 Sl <- sum(rl*(skupina==)) # 40 (sst alt ) E.Sl <- n*(n+1)/ # 3.5 (E 0 [SST alt ]) Zsl <- (Sl-E.Sl)/sqrt(Var.Sw) # 1.17997 (zst alt) p.val <- *(1-pnorm(abs(Zsl))) # 0.351 Sl <- sum(rl*(skupina==1)) # 38 (sst alt ) E.Sl <- n1*(n+1)/ # 45.5 (E 0 [SST alt ]) Zsl <- (Sl-E.Sl)/sqrt(Var.Sw) # -1.17997 (zst alt) p.val <- *(1-pnorm(abs(Zsl))) # 0.351 87/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 88/ 149 Stanislav Katina Analýza prežívania (Survival analysis)

Siegel-Tukey test a Levene test Example (Siegel-Tukey test a Levene test) Naprogramujte v test H 0 : Var[S 1 (t)] = Var[S (t)] oproti alternatíve H 1 : Var[S 1 (t)] Var[S (t)] pomocou S ST a SST alt použitím algoritmu. Okomentujte výsledky. Algoritmus : poradie R 1 priradíme najmenšiemu pozorovaniu poradia R a R 3 priradíme dvom najväčším pozorovaniam poradia R 4 a R 5 priradíme druhému a tretiemu najmenšiemu pozorovaniu atd. Prehl ad testov Testované hypotézy nulovná hypotéza H 0 : S i (t) = S j (t) = S (t) alternatíva hypotéza H 1 : S i (t) S j (t) pre aspoň jedno i,j (KW test) st S i S j (čo je ekv. s S i (t) < S j (t), pre t; J,C,L testy) st S i S j (čo je ekv. s S i (t) > S j (t), pre t; J,C,L testy) i < j, i,j = 1,,...,k k je počet porovnávaných kriviek prežívania S (t) je funkcia prežívania st a st stochasticky menší, resp. stochasticky väčší Označenia X j1,...,x jnj je j-ty NV, i = 1,,...,n j ;j = 1,,...,k R ji poradia X ji v združenom výbere 89/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 90/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Kruskall-Wallis test Ďalšie označenia n = k j=1 n j, n j je počet pozorovaní v j-tom NV S j = n j R ji, S = k j=1 R j, S j = S j /n j, S = S/n = (n + 1)/ Kruskall-Wallisova testovacia štatistika U KW = = = 1 n(n + 1) k j=1 1 k n(n + 1) j=1 1 k Var[R] j=1 ( Sj n j n + 1 n j S j n j 3 (n + 1) S j n j n (n + 1) 4 ) D χ k 1 Realizáciou U KW je u KW = 1 ( ) k n(n+1) j=1 n sj. j n j n+1 91/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Kruskall-Wallisov test Rozptyl poradí R : Var[R t] = Var[R] = 1 n 1 = 1 n 1 n (n + 1) 1 n k j j=1 n k j j=1 1 ( S ji n + 1 ) ( S ji t n + 1 ) 1 n (n 1) Kruskall-Wallisova testovacia štatistika 1 k Ũ KW = Var[R t] Realizáciou ŨKW je ũ KW. j=1 n j ( Sj n j n + 1 L j=1 ( ) t j tj 1 ) D χ k 1 9 / 149 Stanislav Katina Analýza prežívania (Survival analysis)

Jonckheere test Označenia i < j, teda i = 1,,...,k 1;j = 1 + i,...,k, d alej α i = 1,,...,n i, α j = 1,,...,n j nech S ij MW je Mann-Whitney štatistika porovnávajúca i-ty a j-ty výber ( ) S ij MW = # X iαi,x jαj, kde X iαi < X jαj Jonckheere štatistika S J = i<j k 1 S ij MW = k j=1+i S ij MW Realizáciami štatistík S ij MW a S J sú s ij MW a s J. Jonckheere test Stredná hodnota a rozptyl S J : E 0 [S J ] = n n i 4 Var 0 [S J ] = n (n + 3) ni (n i + 3) 7 Jonckheereho testovacia štatistika Realizáciu Z J ozn. z J. Z J = S J E 0 [S J ] Var 0 [S J ] D N (0,1) 93/ 149 Stanislav Katina Analýza prežívania (Survival analysis) 94/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Jonckheere test Alternatívna podoba Jonckheereho štatistiky k 1 J = S alt k j=1+i kde k 1 k j=1+i n in j = max SJ S J Stredná hodnota a rozptyl S alt J : E[S alt k 1 S ij MW k j=1+i n i n j, J ] = 0, Var0 [ ] S alt n (n + 3) n J = i (n i + 3) 18 Alternatívna podoba Jonckheereho testovacej štatistiky [ ] ZJ alt = Salt J E 0 S alt J D N (0,1) Var0 [ ] S alt Realizáciami S alt J a Z alt J sú s alt J J a z alt J. 95/ 149 Stanislav Katina Analýza prežívania (Survival analysis) Kendallov korelačný koeficient Označenia nech (X 1,Y 1 ) T,...,(X n,y n ) T NV z dvojrozmerného rozdelenia dvojicu s indexami i a j, (X i,y i ) a ( X j,y j ), nazveme konkordantná (usporiadaná) pokial platí X i < X j Y i < Y j alebo X i > X j Y i > Y j diskordantná (neusporiadaná) pokial platí X i < X j Y i > Y j alebo X i < X j Y i > Y j ak platí Y i = Y j alebo Y i = Y j, nejde ani o konkordantný ani o diskordantný vzt ah C + D n (n 1), C je počet konkordantných dvojíc, D počet diskonkordantných dvojíc τ = C D n(n 1) 96/ 149 Stanislav Katina Analýza prežívania (Survival analysis)