1 Práca vznikla v spolupráci s J. Volaufovou (School of Public Health, LSU Health Sciences Center, New Orleans, USA a vd aka podpore grantov APVV-0096-10, VEGA 2/0019/10 a VEGA 2/0038/12 Exaktné testy a konfidenčné oblasti pre parametre normálneho lineárneho modelu s dvomi variančnými komponentami Viktor WITKOVSKÝ 1 Ústav merania SAV, Bratislava witkovsky@savba.sk ROBUST 2012 17. letná škola JČMF, 9.9. - 14.9.2012, Němčičky, ČR
Abstrakt V príspevku popíšeme metódu konštrukcie konfidenčných oblastí založených na invertovaní exaktných testov založených na funkcii podielu vierohodností (LRT/RLRT pre parametre normálneho regresného modelu s dvomi variančnými komponentami Y N n(xβ,σ 2 W(λ, kde X je známa (n p matica, β R p je neznámy vektor parametrov a σ 2 W(λ = σ 2 (I n +λv je kovariančná matica, pričom V je známa nezáporne definitná matica, ktorá závisí od neznámych parametrov σ 2 > 0 a λ 0. Práca nadväzuje na publikácie: Crainiceanu - Ruppert (JRSS 2004, Chvosteková - Witkovský (MSR 2009, Volaufová - Witkovský (TMMP 2012, Witkovský - Volaufová (LINSTAT 2012. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 2 / 29
Motivácia 7 Likelihood based Region for (σ B 2, σ 2 6 5 4 σ 3 2 1 0 0 5 10 15 σ A Obr.: Ilustračný príklad: Exaktné konfidenčné oblasti pre variančné komponenety normálneho lineárneho modelu s dvomi variančnými komponentami V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 3 / 29
Obsah 1 Úvod 2 Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Značenie a štandardné výsledky Hypotéza 1: H 1 0 : θ = θ 0 a λ = λ 0 Hypotéza 2: H 2 0 : θ = θ 0 a λ = λ 0 a σ 2 = σ 2 0 Hypotéza 3: H 3 0 : λ = λ 0 Hypotéza 4: H 4 0 : λ = λ 0 a σ 2 = σ 2 0 Pravdepodobnost nulového odhadu ML/REML parametra λ 3 Štandard asymptotické aproximácie 4 Empirická evidencia 5 Neštandardné asymptotické aproximácie Špeciálne prípady Vyvážený ANOVA model jednoduchého triedenia s náhodnými efektami V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 4 / 29
Úvod Uvažujme normálny lineárny regresný model s dvomi variančnými komponentami kde Y je n-rozmerný vektor pozorovaní; Y N n(xβ,σ 2 W(λ, X je známa (n p matica, pričom rank(x = r X p; β R p je neznámy vektor parametrov; σ 2 W(λ = σ 2 (I n +λv je kovariančná matica, ktorá závisí od parametrov σ 2 > 0 a λ 0. V je známa n.n.d. matica, R(V R(X. Často platí, že V = ZZ pre nejakú (n k maticu Z, pričom rank(v = r V k. Špeciálnym prípadom modelu je lineárny zmiešaný model (LMM s dvomi variančnými komponentami: Y = Xβ + Zu +ε, kde u N(0,σ 2 BI k a ε N(0,σ 2 I n, u ε. λ = σ2 B reprezentuje podiel variančných komponentov. σ 2 V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 5 / 29
Úvod V príspevku budeme prezentovat tvar štatistík podielom vierohodností (LRT/RLRT a ich exaktné rozdelenie (za platnosti nulovej hypotézy pre testovanie týchto hypotéz: Hypotéza 1: H0 1 : θ = θ 0 a λ = λ 0 Hypotéza 2: H0 2 : θ = θ 0 a λ = λ 0 and σ 2 = σ0 2 Hypotéza 3: H0 3 : λ = λ 0 Hypotéza 4: H0 4 : λ = λ 0 a σ 2 = σ0 2 kde θ = H β, θ 0 = H β 0, H R(X je známa matica, pričom rank(h = r H r X. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 6 / 29
Úvod Exaktné (nulové rozdelenie LRT/RLRT štatitík pre testovanie hypotéz H 1 0 a H 3 0 odvodili Crainiceanu a Ruppert (JRSS 2004. V príspevku uvedieme alternatívnu reprezentáciu testovacích štatistík a ich nulové rozdelenie, založené na výsledkoch: Volaufová (Probastat 2011, Volaufová (IWMS 2011 a Volaufová and Witkovský (TMMP 2012. Vo všeobecnosti neexistuje jednoduchá analytická reprezentácia exaktných distribučných funkcií (CDF štatistík LRT/RLRT, ktorá by bola vhodná na (rýchle numerické výpočty. Kvantily exaktných rozdelení LRT/RLRT možno odhadnút z empirických distribučných funkcií, získaných pomocou simulácií. Takýto spôsob výpočtu je výpočtovo náročný, ked že v každom kroku simulácie je potrebná numerická optimalizácia (hl adanie maxima v 1-rozmernom priestore. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 7 / 29
Úvod Pre štatistiky LRT/RLRT budeme používat nasledovné označenie: ( LR i (Y H0 i ϑ i 0 = 2 sup H i l(β,λ,σ 2 Y supl(β,λ,σ 2 Y i = 1, 2, 3, 4 0 LR j R (Y Hj 0 ϑj 0 (sup = 2 j H l R (λ,σ 2 Y supl R (λ,σ 2 Y, j = 3, 4 0 ϑ 1 0 = (θ 0,λ 0, ϑ 2 0 = (θ 0,λ 0,σ 2 0, ϑ3 0 = λ 0, ϑ 4 0 = (λ 0,σ 2 0, l(β,λ,σ 2 Y, resp. l R (λ,σ 2 Y, je logaritmus funkcie vierohodnosti modelu (log-likelihood resp. restricted log-likelihood. Motiváciou a konečným ciel om tejto práce je konštrukcia simultánnych konfidenčných oblastí pre parametre modelu pomocou invertovania exaktných testov LRT/RLRT: C i (Y = { ϑ i 0 : LR i (Y ϑ i 0 LR i 1 α(ϑ i 0 }, i = 1, 2, 3, 4 { } C j R (Y = ϑ j 0 : LRj R (Y ϑj 0 LRj R,1 α (ϑj 0, j = 3, 4 LR i 1 α (ϑi 0 a LRj R,1 α (ϑj 0 sú (1 α-kvantily nulového rozdelenia LRi (Y H i 0 resp. LR j R (Y Hj 0. Vo všeobecnosti, exaktné nulové rozdelenie LR i (Y H i 0 resp. LR j R (Y Hj 0 závisí od parametrov ϑ i 0 H i 0. Ako však ukážeme, exaktné rozdelenie LRT/RLRT štatistík pre testovanie uvedených hypotéz závisí len od hodnoty λ 0 H i 0. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 8 / 29
Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Značenie a štandardné výsledky Budeme používat nasledujúce označenia: M X = I n P X, kde P X = X(X X X a rank(m X = r MX = n r X. Ked že R(H R(X, potom existuje matica G, R(G R(X taká, že H = X G, napr. G = X(X X H. M G = I n P G, kde P G = G(G G G, pričom rank(p G = r H. X = M G X = X X, kde X = P G X, rank(x = r H a rank(x = r X r H. M X = I P X, kde P X = X (X X X a rank(p X = r X r H a rank(m X = n r X + r H. M X M X = P X = X (X X 1 X, kde rank(p X = r H. Ekvivalencia podpriestorov Afinná množina stredných hodnôt náhodného vektora Y je posunutý lineárny podpriestor, parametrizovaný vektorom parametrov γ bez d alších obmedzení, t.j. {Xβ : H β = H β 0 } = Xβ 0 +{X γ : γ R r X r H }, kde X = M G X, and any β 0 H i 0, i = 1, 2. Viac podrobnosti možno nájst napr. v prácach Christensen (1987, alebo LaMotte (1998. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 9 / 29
Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Značenie a štandardné výsledky Spektrálny rozklad matice V a výpočet podielu determinantov W(λ 0 / W(λ. Nech 0 ξ 1 < ξ 2 < < ξ s označujú rôzne vlastné čísla matice V s násobnost ami ν ξi pre ξ i. Platí, že nenulové vlastné čísla matíc V a Z Z sú rovnaké. Potom, pre W(λ = I n +λv dostávame log log( W(λ = ( W(λ0 W(λ = s ν ξi log(1+λξ i s ( 1+λ0 ξ i ν ξi log 1+λξ i Uvedené výrazy závisia iba od nenulových vlastných čísel ξ i matice V. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 10 / 29
Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Značenie a štandardné výsledky Pre l ubovol né λ 0 označme ˆσ 2 λ = 1 n Y (M X W(λM X + Y. Rozdelenie odhadu ˆσ λ. 2 Nech B VB = r µiei je spektrálny rozklad, kde B je n (n r X-matica, že BB = M X, B B = I n rx, 0 = µ 0 < µ 1 < < µ r označujú rôzne vlastné čísla matice B VB s násobnost ami ν µi pre µ i a E i sú navzájom ortogonálne projekčné matice. Platí, že nenulové čísla matíc B VB a Z M X Z sú rovnaké. Podl a Olsen, Seely, and Birkes (1976 platí, že Y BE ib Y σ 2 0(1+λ 0 µ iq νµi, i = 0, 1,...,r je množina r + 1 navzájom nezávislých náhodných premenných, pričom Q νµi χ 2 ν µi, kde λ 0,σ0 2 sú skutočné hodnoty parametrov. Odtial pomocou vzt ahov (M X W(λM X + = B(B W(λB 1 B a W(λ = I n +λv dostávame nˆσ 2 λ σ 2 0 r (1+λµ i (1+λ 0 µ i Qνµi. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 11 / 29
Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Značenie a štandardné výsledky Pre λ 0 H i 0, i = 1, 2 označme ˆσ 2 λ 0 = 1 n Y (M X W(λ 0 M X + Y, σ 2 λ 0 = 1 n Y (M X W(λ 0 M X + Y, kde X = M G X a Y = Y Xβ 0, pre l ubovol né β 0 H i 0 (akákol vek vol ba β 0 = (H θ 0. Rozdelenie odhadu σ 2 λ 0 ˆσ 2 λ 0 za platnosti H i 0, i = 1, 2. Ked že platí R(G R(X, dostávame n σ 2 λ 0 σ 2 0 nˆσ2 λ 0 σ 2 0 = 1 Y [ σ0 2 (MX W(λ 0 M X + (M X W(λ 0 M X +] Y = Y (P X W(λ 0 P X + H0 i Y Q rh, kde Q rh χ 2 r H a λ 0,σ 2 0 označuje skutočné hodnoty parametrov. Navyše, Q rh je náhodná premenná nezávislá so všetkými Q νµi. Viac možno nájst napr. v Crainiceanu and Ruppert (JRSS 2004 a Volaufová (IWMS 2011. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 12 / 29
Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 1: H 1 0 : θ = θ 0 a λ = λ 0 Test podielom vierohodností LRT hypotézy 1: H 1 0 : θ = θ 0 a λ = λ 0 Na základe predpokladov o modeli a uvedených tvrdení dostávame: LR 1 (Y H0 1 = n log ( σ 2 λ0 { + sup λ 0 n log ( ˆσ λ 2 + s ( } 1+λ0 ξ i ν ξi log 1+λξ i LR 1 (Y H 1 0 n log ( + sup λ 0 Q rh + { n log r Q νi ( r 1+λ 0 µ i 1+λµ i Q νi + s ( } 1+λ0 ξ i ν ξi log 1+λξ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 13 / 29
Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 2: H 2 0 : θ = θ 0 a λ = λ 0 a σ2 = σ 2 0 Test podielom vierohodností LRT hypotézy 2: H 2 0 : θ = θ 0 a λ = λ 0 a σ 2 = σ 2 0 LR 2 (Y H 2 0 = n σ2 λ 0 σ 2 0 + sup λ 0 n(1 log(n { ( nˆσ 2 n log λ σ 2 0 + s ( } 1+λ0 ξ i ν ξi log 1+λξ i LR 2 (Y H 2 0 Q rh + + sup λ 0 r Q νi n(1 log(n { n log ( r 1+λ 0 µ i 1+λµ i Q νi + s ( } 1+λ0 ξ i ν ξi log 1+λξ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 14 / 29
Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 3: H 3 0 : λ = λ 0 Test podielom vierohodností LRT hypotézy 3: H 3 0 : λ = λ 0 LR 3 (Y H0 3 = n log (ˆσ 2 λ0 { + sup λ 0 n log ( ˆσ λ 2 + s ( } 1+λ0 ξ i ν ξi log 1+λξ i ( r LR 3 (Y H0 3 n log Q νi + sup λ 0 { n log ( r 1+λ 0 µ i 1+λµ i Q νi + s ( } 1+λ0 ξ i ν ξi log 1+λξ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 15 / 29
Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 4: H 4 0 : λ = λ 0 a σ2 = σ 2 0 Test podielom vierohodností LRT hypotézy 4: H 4 0 : λ = λ 0 a σ 2 = σ 2 0 LR 4 (Y H 4 0 = nˆσ2 λ 0 σ 2 0 + sup λ 0 n(1 log(n { ( nˆσ 2 n log λ σ 2 0 + s ( } 1+λ0 ξ i ν ξi log 1+λξ i LR 4 (Y H 4 0 r Q νi n(1 log(n + sup λ 0 { n log ( r 1+λ 0 µ i 1+λµ i Q νi + s ( } 1+λ0 ξ i ν ξi log 1+λξ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 16 / 29
Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 4: H 4 0 : λ = λ 0 a σ2 = σ 2 0 Test podielom vierohodností RLRT hypotézy 3: H 3 0 : λ = λ 0 LR 3 R(Y H0 3 = (n r X log (ˆσ 2 λ0 { + sup λ 0 (n r X log ( ˆσ λ 2 + r ( } 1+λ0 µ i ν i log 1+λµ i ( r LR 3 R(Y H0 3 (n r X log Q νi + sup λ 0 { (n r X log ( r 1+λ 0 µ i 1+λµ i Q νi + r ( } 1+λ0 µ i ν i log 1+λµ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 17 / 29
Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 4: H 4 0 : λ = λ 0 a σ2 = σ 2 0 Test podielom vierohodností RLRT hypotézy 4: H 4 0 : λ = λ 0 a σ 2 = σ 2 0 LR 4 R(Y H0 4 = nˆσ2 λ 0 (n r X (1 log(n r X σ 2 0 + sup λ 0 { ( nˆσ 2 (n r X log λ σ 2 0 + r ( } 1+λ0 µ i ν i log 1+λµ i LR 4 R(Y H 4 0 r Q νi (n r X (1 log(n r X + sup λ 0 { (n r X log ( r 1+λ 0 µ i 1+λµ i Q νi + r ( } 1+λ0 µ i ν i log 1+λµ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 18 / 29
Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Pravdepodobnost nulového odhadu ML/REML parametra λ Pr(ˆλ ML = 0 λ 0 & Pr(ˆλ REML = 0 λ 0 Označme f LRT (λ λ 0 = f RLRT (λ λ 0 = { ( r 1+λ 0 µ i s ( } 1+λ0 ξ i n log Q νi + ν ξi log 1+λµ i 1+λξ i { ( r 1+λ 0 µ i r ( } 1+λ0 µ i (n r X log Q νi + ν i log 1+λµ i 1+λµ i Potom ˆλ ML = arg sup λ 0 {f LRT (λ λ 0 }, a ˆλ REML = arg sup λ 0 {f RLRT (λ λ 0 }. Podmienenú pravdepodobnost toho, že ML/REML odhad parametra λ bude 0 pokial skutočný parameter je λ 0, možno odhadnút : ( flrt (λ λ 0 Pr(ˆλ ML = 0 λ 0 Pr λ=0 0 λ ( r = Pr (µ i ξ(1+λ 0 µ iq νi 0 kde ξ = 1 n ( r Pr(ˆλ REML = 0 λ 0 Pr (µ i µ(1+λ 0 µ iq νi 0 s ν ξ i ξ i a µ = 1 r n r X νiµi. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 19 / 29
Štandard asymptotické aproximácie Za predpokladu, že požadované predpoklady platia a testovaná hodnota λ 0 je vo vnútri parametrického priestoru, t.j. λ 0 > 0, štandardnou asymptotickou aproximáciou nulového rozdelenia danej LRT/RLRT štatistiky pre dostatočne vel ký rozsah výberu je D LR(Y H 0 χ 2 d, kde d je počet reštrikcií na parametre modelu. Pre λ 0 na hranici parametrického priestoru, t.j. λ 0 = 0, Stram and Lee (Biometrics 1994 navrhli aproximáciu nulového rozdelenia danej LRT/RLRT štatistiky pre dostatočne vel ký rozsah výberu ako zmes rozdelení LR(Y H 0 kde d je počet reštrikcií na parametre modelu. D 0.5χ 2 d 1 : 0.5χ 2 d, Pinheiro and Bates (2000 navrhli aproximáciu nulového rozdelenia danej LRT/RLRT štatistiky pre λ 0 na hranici parametrického priestoru ako zmes rozdelení s rozdielnými váhami: LR(Y H 0 kde d je počet reštrikcií na parametre modelu. D 0.65χ 2 d 1 : 0.35χ 2 d, V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 20 / 29
Empirická evidencia Vlastnosti exaktného nulového rozdelenia LRT/RLRT štatistík budeme ilustrovat na špecifickom príkalde: Uvažujme model Y = Xβ + Zu +ε, Uvažujeme tu model vhodný pre výbery z dvoch populácií s rôznym počtom výberových jednotiek (m 1, m 2, tu m = m 1 + m 2 = 5+7 = 12 výberových jednotiek (subjektov, pričom na subjekte i máme T i opakovaných pozorovaní v rôznych časoch, T i {1, 3, 3, 6, 9} pre prvú populáciu, a T i {3, 5, 9, 11, 5, 4, 3} pre druhú populáciu. Pozorovania Y, modelujeme ako Y = [X 1, X 2 ](β 1,β 2, kde Y je n = m Ti = 62 dimenzionálny vektor, X 1 reprezentuje s vysvetl ujúcu premennú (funkciu času a stĺpce X 2 reprezentujú pomocné (dummy premenné pre rozlíšenie dvoch populácií. Teda β 1 je skalár, a β 2 je 2-rozmerný vektor. V tomto modeli uvažujeme ako H 1,2 0 hypotézu, že β 1 = 0. Odozva Y bola modelovaná pomocou modelu s náhodnými koeficientami (intercepts, s (n m maticou Z plnej hodnosti, kde stĺpce reprezentovali pomocné premenné pre m výberových jednotiek (subjektov, t.j. V = ZZ, pričom r V = 12, teda pomocou LMM s dvomi variančnými komponentami. Viac podrobnosti o štruktúre daného modelu možno nájst v práci Volaufová and Witkovský (TMMP 2012. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 21 / 29
Empirická evidencia LRT hypotézy 1: H 1 0 : θ = θ 0 a λ = λ 0 1 LRT of Hypothesis 1: H 0 : Xβ = Xβ 0 & λ = λ 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 1 (Y H 0 1 pre rôzne hodnoty λ 0, pričom h = r H = 1. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: (i zmes rozdelení 0.5χ 2 (h : 0.5χ 2 (h + 1 a rozdelením χ 2 (h + 1, (ii zmes rozdelení wχ 2 (h : (1 wχ 2 (h + 1, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality h+1,δ δ = 0.45. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 22 / 29
Empirická evidencia LRT hypotézy 1: H 1 0 : θ = θ 0 a λ = λ 0 1 LRT of Hypothesis 1: H 0 : Xβ = Xβ 0 & λ = λ 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 1 (Y H 0 1 pre rôzne hodnoty λ 0, pričom h = r H = 1. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: (i zmes rozdelení 0.5χ 2 (h : 0.5χ 2 (h + 1 a rozdelením χ 2 (h + 1, (ii zmes rozdelení wχ 2 (h : (1 wχ 2 (h + 1, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality h+1,δ δ = 0.45. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 22 / 29
Empirická evidencia LRT hypotézy 1: H 1 0 : θ = θ 0 a λ = λ 0 1 LRT of Hypothesis 1: H 0 : Xβ = Xβ 0 & λ = λ 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 1 (Y H 0 1 pre rôzne hodnoty λ 0, pričom h = r H = 1. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: (i zmes rozdelení 0.5χ 2 (h : 0.5χ 2 (h + 1 a rozdelením χ 2 (h + 1, (ii zmes rozdelení wχ 2 (h : (1 wχ 2 (h + 1, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality h+1,δ δ = 0.45. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 22 / 29
Empirická evidencia LRT hypotézy 2: H 2 0 : θ = θ 0 a λ = λ 0 a σ 2 = σ 2 0 1 LRT of Hypothesis 2: H 0 : Xβ = Xβ 0 & λ = λ 0 & σ 2 = σ 2 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 2 (Y H 0 2 pre rôzne hodnoty λ 0, pričom h = r H = 1. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: zmes rozdelení wχ 2 (h + 1 : (1 wχ 2 (h + 2, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality δ = 0.45. h+2,δ V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 23 / 29
Empirická evidencia LRT hypotézy 3: H 3 0 : λ = λ 0 1 LRT of Hypothesis 3: λ = λ 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 3 (Y H 3 0 pre rôzne hodnoty λ 0. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: zmes rozdelení wχ 2 (0 : (1 wχ 2 (1, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality δ = 0.45. 1,δ V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 24 / 29
Empirická evidencia LRT hypotézy 4: H 4 0 : λ = λ 0 a σ 2 = σ 2 0 1 LRT of Hypothesis 4: H 0 : λ = λ 0 & σ 2 = σ 2 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 4 (Y H 4 0 pre rôzne hodnoty λ 0. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: zmes rozdelení wχ 2 (1 : (1 wχ 2 (2, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality δ = 0.45. 2,δ V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 25 / 29
Empirická evidencia RLRT hypotézy 3: H 3 0 : λ = λ 0 1 RLRT of Hypothesis 3: λ = λ 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 3 R (Y H3 0 pre rôzne hodnoty λ 0. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: zmes rozdelení wχ 2 (0 : (1 wχ 2 (1, kde w = Pr(ˆλ REML = 0 λ 0 = 0 = 0.5635 a centrálnym rozdelením χ 2 1. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 26 / 29
Empirická evidencia Test podielom vierohodností RLRT hypotézy 4: H 4 0 : λ = λ 0 a σ 2 = σ 2 0 1 RLRT of Hypothesis 4: H 0 : λ = λ 0 & σ 2 = σ 2 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 3 R (Y H3 0 pre rôzne hodnoty λ 0. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: zmes rozdelení wχ 2 (1 : (1 wχ 2 (2, kde w = Pr(ˆλ REML = 0 λ 0 = 0 = 0.5635 a centrálnym rozdelením χ 2 2. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 27 / 29
Neštandardné asymptotické aproximácie Špeciálne prípady Exaktné nulové rozdelenie LR/RLRT štatistík závisí na vlastných číslach µ i,n a ξ j,n matíc modelu pre n-rozmerný vektor Y. Pre testovanie hypotéz H 1 0 a H 3 0, pričom λ 0 = 0, Crainiceanu and Rupert (2004 navrhli asymptotickú aproximáciu, založenú na predpokladoch: Nech rank(v = r V je pevne daná a nech µ i,n lim n lim n n γ ξ i,n n γ pre nejaké γ 0. Potom r LR 1 (Y H0 1 D Q rh + sup λ 0 r LR 3 (Y H0 3 D sup λ 0 { r LRR(Y 3 H0 3 D sup λ 0 = µ i, = ξ i, λµ i, 1+ λµ i, Q νi λµ i, 1+ λµ i, Q νi λµ i, 1+ λµ i, Q νi s ν ξj log(1+ λξ j, j=1 s ν ξj log(1+ λξ j,, j=1 } r ν µi log(1+ λµ i,. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 28 / 29
Neštandardné asymptotické aproximácie Vyvážený ANOVA model jednoduchého triedenia s náhodnými efektami Pre ilustráciu uvažujme vyvážený ANOVA model jednoduchého triedenia s náhodnými efektami, s K úrovňami a J pozorovaniami pre každú úroveň. Potom, n = KJ, rank(v = r V = K a zodpovedajúce vlastné čísla sú µ 0,n = 0 s násobnost ou ν µ,0 = n K, µ 1,n = J s násobnost ou ν µ,1 = K 1, ξ 1,n = 0 s násobnost ou ν ξ,1 = n K, ξ 2,n = J s násobnost ou ν ξ,1 = K. Za platnosti nulovej hypotézy H0 3 : λ 0 = 0 exaktné rozdelenie RLRT štatistiky LR 3 R (Y H3 0 je { ( } LRR(Y 3 H0 3 QK 1 n log(q K 1 +Q n K + inf n log λ 0 1+λJ + Q n K K log(1+λj Crainiceanu and Rupert (2004 navrhli asymptotickú aproximáciu rozdelenia pre J a konštantnú hodnotu K ako LR 3 R(Y H 3 0 D {(Q K 1 K K log(q K 1 /K} I(Q K 1 > K, Toto asymptotické rozdelenie má v nule hodnotu rovnú Pr(Q K 1 < K. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 29 / 29