Exaktné testy a konfidencné oblasti pre parametre normálneho lineárneho modelu s dvomi variancnými komponentami

Podobné dokumenty
Viacnásobne použitelné oblasti spolahlivosti pre viacrozmernú kalibráciu

8 Cvičenie 1.1 Dokážte, že pre ľubovoľné body X, Y, Z platí X + Y Z = Z + Y X. 1.2 Dokážte, že pre ľubovoľné body A, B, D, E, F, G afinného priestoru

Teória pravdepodobnosti Zákony velkých císel

Axióma výberu

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy Beáta Stehlíková Časové rady, FMFI UK, 2011/2012 Jednotkový koreň(unit roo

III. Diferenciálny počet funkcie viac premenných (Prezentácia k prednáškam, čast B) Matematická analýza IV (ÚMV/MAN2d/10) RNDr. Lenka Halčinová, PhD.

1. KOMPLEXNÉ ČÍSLA 1. Nájdite výsledok operácie v tvare x+yi, kde x, y R. a i (5 2i)(4 i) b. i(1 + i)(1 i)(1 + 2i)(1 2i) (1 7i) c. (2+3i) a+bi d

Prenosový kanál a jeho kapacita

2.5. Dotyčnica krivky, dotykový kužeľ. Nech f je krivka a nech P V (f) (t.j. m P (f) 1). Ak m P (f) = r a l je taká priamka, že I P (f, l) > r, potom

Informačná a modelová podpora pre kvantifikáciu prvkov daňovej sústavy SR

Analýza hlavných komponentov

Základné stochastické procesy vo financiách

Úvod do lineárnej algebry Monika Molnárová Prednášky 2006

Štruktúra Modelu Výsledky odhadu Záver Trh práce v krajinách strednej Európy: Small Search and Matching Model Martin Železník Národná Banka Slovenska

Numerické riešenie všeobecnej (klasickej) DMPK rovnice.

Paralelné algoritmy, cast c. 2

Metódy dokazovanie v matematike 1 Základné pojmy Matematika exaktná veda vybudovaná DEDUKTÍVNE ZÁKLADNÉ POJMY základy každej matematickej teórie sú in

TESTOVANIE STABILITY PROCESU POKRAČOVANIA GRADIOMETRICKÝCH MERANÍ DRUŽICE GOCE NADOL

Preco kocka stací? - o tom, ako sú rozdelené vlastné hodnoty laplasiánu v limite, ked sú velké

Regresné modely pre nespojité veliciny

SRPkapitola06_v1.docx

Aplikace matematiky- záverečná práca Juraj Bodík 28. septembra 2017 Definície Žena - objekt ohodnotený celým číslom. Každé dve ženy sa dajú porovnat a

Vybrané kapitoly zo štatistickej fyziky - domáce úlohy Michal Koval 19. mája 2015 Domáca úloha č. 1 (pochádza z: [3]) Systém pozos

Analýza sociálnych sietí Geografická lokalizácia krajín EU

ARMA modely čast 3: zmiešané modely (ARMA) Beáta Stehlíková Časové rady, FMFI UK ARMA modely časť 3: zmiešané modely(arma) p.1/30

Neineárne programovanie zimný semester 2018/19 M. Trnovská, KAMŠ, FMFI UK 1

WP summary

Operačná analýza 2

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ BRNO UNIVERSITY OF TECHNOLOGY FAKULTA STROJNíHO INŽENÝRSTVí ÚSTAV MATEMATIKY FACULTY OF MECHANICAL ENGINEERING INSTITUTE

Paralelné algoritmy, cast c. 3

Oceňovanie amerických opcií p. 1/17 Oceňovanie amerických opcií Beáta Stehlíková Finančné deriváty, FMFI UK Bratislava

Microsoft Word - 6 Výrazy a vzorce.doc

Monday 25 th February, 2013, 11:54 Rozmerová analýza M. Gintner 1.1 Rozmerová analýza ako a prečo to funguje Skúsenost nás učí, že náš svet je poznate

Microsoft Word - Zaver.pisomka_januar2010.doc

Operačná analýza 2

Pokrocilé programovanie XI - Diagonalizácia matíc

APROXIMÁCIA BINOMICKÉHO ROZDELENIA NORMÁLNYM A PRÍKLAD JEJ APLIKÁCIE V AKTUÁRSTVE S VYUŽITÍM JAZYKA R Abstrakt Príspevok sa zameriava na prezentáciu l

Microsoft Word - 16.kapitola.doc

4. Pravidlo ret azenia. Často sa stretávame so skupinami premenných, ktoré zložitým spôsobom závisia od iných skupín premenných. Pravidlo ret azenia p

O možnosti riešenia deformácie zemského povrchu z pohladu metódy konecných prvkov konference pro studenty matematiky

Modelovanie nového produktu na trhu: Bassov model Beáta Stehlíková Cvičenia z časových radov, FMFI UK Modelovanie nového produktu na trhu: Bassov mode

Pocítacové modelovanie - Šírenie vln v nehomogénnom prostredí - FDTD

SK MATEMATICKÁOLYMPIÁDA skmo.sk 2009/ ročník MO Riešenia úloh česko-poľsko-slovenského stretnutia 1. Určte všetky trojice (a, b, c) kladných r

Analýza přežití s programem STATISTICA

Ekon Supply of labour by John Pencavel

9. kapitola Maticová algebra II systém lineárnych rovníc, Frobeniova veta, Gaussova eliminačná metóda, determinanty 1. Systém lineárnych rovníc Systém

Podpora metód operačného výskumu pri navrhovaní systému liniek doc. RNDr. Štefan PEŠKO, CSc. Katedra matematických metód, Fa

Bariéra, rezonančné tunelovanie Peter Markoš, KF FEI STU February 25, 2008 Typeset by FoilTEX

Matematika 2 - cast: Funkcia viac premenných

Operačná analýza 2

MO_pred1

Generovanie viacstavových modelov a ich riešenie v Maxime 1 Jozef Fecenko Abstrakt Cieľom príspevku je prezentovať zdrojový kód v open source systéme

Univerzita Karlova v Praze Matematicko-fyzikální fakulta BAKALÁRSKA PRÁCA Monika Jakubcová Štatistická analýza cenzorovaných dát Katedra pravdepodobno

Microsoft PowerPoint - Zeman_Senaj.ppt

Snímka 1

UNIVERZITA KOMENSKÉHO V BRATISLAVE FAKULTA MATEMATIKY, FYZIKY A INFORMATIKY Viacrozmerné neparametrické testy nezávislosti DIPLOMOVÁ PRÁCA 2019 L udov

Univerzita Komenského v Bratislave Fakulta Matematiky, Fyziky a Informatiky Niektoré metrické vlastnosti čiastočných náhodných booleovských funkcií Di

S rok 2 roky t = 4 1 rok MATEMATIKA I A REPETITÓRIUM Z MATEMATIKY pre Hospodársku informatiku Monika Molnárová Košice 2018

Paralelné algoritmy, cast c. 3

Kolmogorovská zložitost

Pacakova.Viera

Metodika na použitie lesného reprodukčného materiálu na obnovu lesa a zalesňovanie z obchodnej výmeny alebo z dovozu Národné lesnícke centrum (ďalej l

Univerzita Karlova v Praze Matematicko-fyzikální fakulta BAKALÁŘSKÁ PRÁCE Ján Eliaš Problémy spojené s výpočtem největšího společného dělitele Katedra

UNIVERZITA KOMENSKÉHO V BRATISLAVE FAKULTA MATEMATIKY, FYZIKY A INFORMATIKY Kernel metódy a aplikácie DIPLOMOVÁ PRÁCA 2018 Bc. Oliver Dendis

Microsoft Word - Transparencies03.doc

A 1

Univerzita Karlova v Praze Matematicko-fyzikální fakulta DIPLOMOVÁ PRÁCA Monika Babiaková Kreditné riziko Katedra pravděpodobnosti a matematické stati

Microsoft Word - mnohouholnik.doc

Microsoft Word - skripta3b.doc

Úvodná prednáška z RaL

gis5 prifuk

Snímka 1

Název práce

Bakalárska práca

Cvičenie 9 Riešené príklady 1. Príklad min f(x 1, x 2 ) = x x x 1 s.t. x 1 80 x 1 + x Pre riešenie úlohy vykonáme nasledujúce kroky

Snímka 1

UNIVERZITA KOMENSKÉHO V BRATISLAVE FAKULTA MATEMATIKY, FYZIKY A INFORMATIKY MODELY SPOTOVÝCH CIEN ELEKTRICKEJ ENERGIE S PREPÍNANÍM REŽIMOV DIPLOMOVÁ P

Študent 1. kapitola Maticová algebra I 1.1 Definícia matice V mnohých prípadoch dáta majú štruktúru dvojrozmernej tabuľky, ktorá má m riadkov a n stĺp

Lukacikova-Lukacik-Szomolanyi2006

8

Zvýšenie kvality......

Úvod k semináru o SPGS\(SKPOS\) 2003

Informačné technológie

PowerPoint Presentation

NSK Karta PDF

Optimal approximate designs for comparison with control in dose-escalation studies

Dokonalé a spriatelené čísla 3. kapitola. Pojem hustoty množiny v teorii čísel a dokonalé čísla In: Tibor Šalát (author): Dokonalé a spriatelené čísla

Klasické a kvantové vĺny na rozhraniach. Peter Markoš, KF FEI STU April 14, 2008 Typeset by FoilTEX

Autoregresné (AR) procesy Beáta Stehlíková Časové rady, FMFI UK Autoregresné(AR) procesy p.1/22

Models of marital status and childbearing

Zvýšenie kvality......

03_ControlFlow.dvi

Testy z CSS_2015_16

trafo

unhbox group let unhbox hbox {Sglobal mathchardef spacefactor }accent 20 Segroup spacefactor acce

EURÓPSKA KOMISIA V Bruseli XXX [ ](2013) XXX draft OZNÁMENIE KOMISIE Uplatňovanie článku 260 Zmluvy o fungovaní Európskej únie. Aktualizácia údajov po

Matematický model činnosti sekvenčného obvodu 7 MATEMATICKÝ MODEL ČINNOSTI SEKVENČNÉHO OBVODU Konečný automat predstavuje matematický model sekvenčnéh

Prepis:

1 Práca vznikla v spolupráci s J. Volaufovou (School of Public Health, LSU Health Sciences Center, New Orleans, USA a vd aka podpore grantov APVV-0096-10, VEGA 2/0019/10 a VEGA 2/0038/12 Exaktné testy a konfidenčné oblasti pre parametre normálneho lineárneho modelu s dvomi variančnými komponentami Viktor WITKOVSKÝ 1 Ústav merania SAV, Bratislava witkovsky@savba.sk ROBUST 2012 17. letná škola JČMF, 9.9. - 14.9.2012, Němčičky, ČR

Abstrakt V príspevku popíšeme metódu konštrukcie konfidenčných oblastí založených na invertovaní exaktných testov založených na funkcii podielu vierohodností (LRT/RLRT pre parametre normálneho regresného modelu s dvomi variančnými komponentami Y N n(xβ,σ 2 W(λ, kde X je známa (n p matica, β R p je neznámy vektor parametrov a σ 2 W(λ = σ 2 (I n +λv je kovariančná matica, pričom V je známa nezáporne definitná matica, ktorá závisí od neznámych parametrov σ 2 > 0 a λ 0. Práca nadväzuje na publikácie: Crainiceanu - Ruppert (JRSS 2004, Chvosteková - Witkovský (MSR 2009, Volaufová - Witkovský (TMMP 2012, Witkovský - Volaufová (LINSTAT 2012. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 2 / 29

Motivácia 7 Likelihood based Region for (σ B 2, σ 2 6 5 4 σ 3 2 1 0 0 5 10 15 σ A Obr.: Ilustračný príklad: Exaktné konfidenčné oblasti pre variančné komponenety normálneho lineárneho modelu s dvomi variančnými komponentami V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 3 / 29

Obsah 1 Úvod 2 Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Značenie a štandardné výsledky Hypotéza 1: H 1 0 : θ = θ 0 a λ = λ 0 Hypotéza 2: H 2 0 : θ = θ 0 a λ = λ 0 a σ 2 = σ 2 0 Hypotéza 3: H 3 0 : λ = λ 0 Hypotéza 4: H 4 0 : λ = λ 0 a σ 2 = σ 2 0 Pravdepodobnost nulového odhadu ML/REML parametra λ 3 Štandard asymptotické aproximácie 4 Empirická evidencia 5 Neštandardné asymptotické aproximácie Špeciálne prípady Vyvážený ANOVA model jednoduchého triedenia s náhodnými efektami V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 4 / 29

Úvod Uvažujme normálny lineárny regresný model s dvomi variančnými komponentami kde Y je n-rozmerný vektor pozorovaní; Y N n(xβ,σ 2 W(λ, X je známa (n p matica, pričom rank(x = r X p; β R p je neznámy vektor parametrov; σ 2 W(λ = σ 2 (I n +λv je kovariančná matica, ktorá závisí od parametrov σ 2 > 0 a λ 0. V je známa n.n.d. matica, R(V R(X. Často platí, že V = ZZ pre nejakú (n k maticu Z, pričom rank(v = r V k. Špeciálnym prípadom modelu je lineárny zmiešaný model (LMM s dvomi variančnými komponentami: Y = Xβ + Zu +ε, kde u N(0,σ 2 BI k a ε N(0,σ 2 I n, u ε. λ = σ2 B reprezentuje podiel variančných komponentov. σ 2 V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 5 / 29

Úvod V príspevku budeme prezentovat tvar štatistík podielom vierohodností (LRT/RLRT a ich exaktné rozdelenie (za platnosti nulovej hypotézy pre testovanie týchto hypotéz: Hypotéza 1: H0 1 : θ = θ 0 a λ = λ 0 Hypotéza 2: H0 2 : θ = θ 0 a λ = λ 0 and σ 2 = σ0 2 Hypotéza 3: H0 3 : λ = λ 0 Hypotéza 4: H0 4 : λ = λ 0 a σ 2 = σ0 2 kde θ = H β, θ 0 = H β 0, H R(X je známa matica, pričom rank(h = r H r X. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 6 / 29

Úvod Exaktné (nulové rozdelenie LRT/RLRT štatitík pre testovanie hypotéz H 1 0 a H 3 0 odvodili Crainiceanu a Ruppert (JRSS 2004. V príspevku uvedieme alternatívnu reprezentáciu testovacích štatistík a ich nulové rozdelenie, založené na výsledkoch: Volaufová (Probastat 2011, Volaufová (IWMS 2011 a Volaufová and Witkovský (TMMP 2012. Vo všeobecnosti neexistuje jednoduchá analytická reprezentácia exaktných distribučných funkcií (CDF štatistík LRT/RLRT, ktorá by bola vhodná na (rýchle numerické výpočty. Kvantily exaktných rozdelení LRT/RLRT možno odhadnút z empirických distribučných funkcií, získaných pomocou simulácií. Takýto spôsob výpočtu je výpočtovo náročný, ked že v každom kroku simulácie je potrebná numerická optimalizácia (hl adanie maxima v 1-rozmernom priestore. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 7 / 29

Úvod Pre štatistiky LRT/RLRT budeme používat nasledovné označenie: ( LR i (Y H0 i ϑ i 0 = 2 sup H i l(β,λ,σ 2 Y supl(β,λ,σ 2 Y i = 1, 2, 3, 4 0 LR j R (Y Hj 0 ϑj 0 (sup = 2 j H l R (λ,σ 2 Y supl R (λ,σ 2 Y, j = 3, 4 0 ϑ 1 0 = (θ 0,λ 0, ϑ 2 0 = (θ 0,λ 0,σ 2 0, ϑ3 0 = λ 0, ϑ 4 0 = (λ 0,σ 2 0, l(β,λ,σ 2 Y, resp. l R (λ,σ 2 Y, je logaritmus funkcie vierohodnosti modelu (log-likelihood resp. restricted log-likelihood. Motiváciou a konečným ciel om tejto práce je konštrukcia simultánnych konfidenčných oblastí pre parametre modelu pomocou invertovania exaktných testov LRT/RLRT: C i (Y = { ϑ i 0 : LR i (Y ϑ i 0 LR i 1 α(ϑ i 0 }, i = 1, 2, 3, 4 { } C j R (Y = ϑ j 0 : LRj R (Y ϑj 0 LRj R,1 α (ϑj 0, j = 3, 4 LR i 1 α (ϑi 0 a LRj R,1 α (ϑj 0 sú (1 α-kvantily nulového rozdelenia LRi (Y H i 0 resp. LR j R (Y Hj 0. Vo všeobecnosti, exaktné nulové rozdelenie LR i (Y H i 0 resp. LR j R (Y Hj 0 závisí od parametrov ϑ i 0 H i 0. Ako však ukážeme, exaktné rozdelenie LRT/RLRT štatistík pre testovanie uvedených hypotéz závisí len od hodnoty λ 0 H i 0. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 8 / 29

Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Značenie a štandardné výsledky Budeme používat nasledujúce označenia: M X = I n P X, kde P X = X(X X X a rank(m X = r MX = n r X. Ked že R(H R(X, potom existuje matica G, R(G R(X taká, že H = X G, napr. G = X(X X H. M G = I n P G, kde P G = G(G G G, pričom rank(p G = r H. X = M G X = X X, kde X = P G X, rank(x = r H a rank(x = r X r H. M X = I P X, kde P X = X (X X X a rank(p X = r X r H a rank(m X = n r X + r H. M X M X = P X = X (X X 1 X, kde rank(p X = r H. Ekvivalencia podpriestorov Afinná množina stredných hodnôt náhodného vektora Y je posunutý lineárny podpriestor, parametrizovaný vektorom parametrov γ bez d alších obmedzení, t.j. {Xβ : H β = H β 0 } = Xβ 0 +{X γ : γ R r X r H }, kde X = M G X, and any β 0 H i 0, i = 1, 2. Viac podrobnosti možno nájst napr. v prácach Christensen (1987, alebo LaMotte (1998. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 9 / 29

Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Značenie a štandardné výsledky Spektrálny rozklad matice V a výpočet podielu determinantov W(λ 0 / W(λ. Nech 0 ξ 1 < ξ 2 < < ξ s označujú rôzne vlastné čísla matice V s násobnost ami ν ξi pre ξ i. Platí, že nenulové vlastné čísla matíc V a Z Z sú rovnaké. Potom, pre W(λ = I n +λv dostávame log log( W(λ = ( W(λ0 W(λ = s ν ξi log(1+λξ i s ( 1+λ0 ξ i ν ξi log 1+λξ i Uvedené výrazy závisia iba od nenulových vlastných čísel ξ i matice V. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 10 / 29

Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Značenie a štandardné výsledky Pre l ubovol né λ 0 označme ˆσ 2 λ = 1 n Y (M X W(λM X + Y. Rozdelenie odhadu ˆσ λ. 2 Nech B VB = r µiei je spektrálny rozklad, kde B je n (n r X-matica, že BB = M X, B B = I n rx, 0 = µ 0 < µ 1 < < µ r označujú rôzne vlastné čísla matice B VB s násobnost ami ν µi pre µ i a E i sú navzájom ortogonálne projekčné matice. Platí, že nenulové čísla matíc B VB a Z M X Z sú rovnaké. Podl a Olsen, Seely, and Birkes (1976 platí, že Y BE ib Y σ 2 0(1+λ 0 µ iq νµi, i = 0, 1,...,r je množina r + 1 navzájom nezávislých náhodných premenných, pričom Q νµi χ 2 ν µi, kde λ 0,σ0 2 sú skutočné hodnoty parametrov. Odtial pomocou vzt ahov (M X W(λM X + = B(B W(λB 1 B a W(λ = I n +λv dostávame nˆσ 2 λ σ 2 0 r (1+λµ i (1+λ 0 µ i Qνµi. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 11 / 29

Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Značenie a štandardné výsledky Pre λ 0 H i 0, i = 1, 2 označme ˆσ 2 λ 0 = 1 n Y (M X W(λ 0 M X + Y, σ 2 λ 0 = 1 n Y (M X W(λ 0 M X + Y, kde X = M G X a Y = Y Xβ 0, pre l ubovol né β 0 H i 0 (akákol vek vol ba β 0 = (H θ 0. Rozdelenie odhadu σ 2 λ 0 ˆσ 2 λ 0 za platnosti H i 0, i = 1, 2. Ked že platí R(G R(X, dostávame n σ 2 λ 0 σ 2 0 nˆσ2 λ 0 σ 2 0 = 1 Y [ σ0 2 (MX W(λ 0 M X + (M X W(λ 0 M X +] Y = Y (P X W(λ 0 P X + H0 i Y Q rh, kde Q rh χ 2 r H a λ 0,σ 2 0 označuje skutočné hodnoty parametrov. Navyše, Q rh je náhodná premenná nezávislá so všetkými Q νµi. Viac možno nájst napr. v Crainiceanu and Ruppert (JRSS 2004 a Volaufová (IWMS 2011. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 12 / 29

Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 1: H 1 0 : θ = θ 0 a λ = λ 0 Test podielom vierohodností LRT hypotézy 1: H 1 0 : θ = θ 0 a λ = λ 0 Na základe predpokladov o modeli a uvedených tvrdení dostávame: LR 1 (Y H0 1 = n log ( σ 2 λ0 { + sup λ 0 n log ( ˆσ λ 2 + s ( } 1+λ0 ξ i ν ξi log 1+λξ i LR 1 (Y H 1 0 n log ( + sup λ 0 Q rh + { n log r Q νi ( r 1+λ 0 µ i 1+λµ i Q νi + s ( } 1+λ0 ξ i ν ξi log 1+λξ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 13 / 29

Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 2: H 2 0 : θ = θ 0 a λ = λ 0 a σ2 = σ 2 0 Test podielom vierohodností LRT hypotézy 2: H 2 0 : θ = θ 0 a λ = λ 0 a σ 2 = σ 2 0 LR 2 (Y H 2 0 = n σ2 λ 0 σ 2 0 + sup λ 0 n(1 log(n { ( nˆσ 2 n log λ σ 2 0 + s ( } 1+λ0 ξ i ν ξi log 1+λξ i LR 2 (Y H 2 0 Q rh + + sup λ 0 r Q νi n(1 log(n { n log ( r 1+λ 0 µ i 1+λµ i Q νi + s ( } 1+λ0 ξ i ν ξi log 1+λξ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 14 / 29

Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 3: H 3 0 : λ = λ 0 Test podielom vierohodností LRT hypotézy 3: H 3 0 : λ = λ 0 LR 3 (Y H0 3 = n log (ˆσ 2 λ0 { + sup λ 0 n log ( ˆσ λ 2 + s ( } 1+λ0 ξ i ν ξi log 1+λξ i ( r LR 3 (Y H0 3 n log Q νi + sup λ 0 { n log ( r 1+λ 0 µ i 1+λµ i Q νi + s ( } 1+λ0 ξ i ν ξi log 1+λξ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 15 / 29

Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 4: H 4 0 : λ = λ 0 a σ2 = σ 2 0 Test podielom vierohodností LRT hypotézy 4: H 4 0 : λ = λ 0 a σ 2 = σ 2 0 LR 4 (Y H 4 0 = nˆσ2 λ 0 σ 2 0 + sup λ 0 n(1 log(n { ( nˆσ 2 n log λ σ 2 0 + s ( } 1+λ0 ξ i ν ξi log 1+λξ i LR 4 (Y H 4 0 r Q νi n(1 log(n + sup λ 0 { n log ( r 1+λ 0 µ i 1+λµ i Q νi + s ( } 1+λ0 ξ i ν ξi log 1+λξ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 16 / 29

Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 4: H 4 0 : λ = λ 0 a σ2 = σ 2 0 Test podielom vierohodností RLRT hypotézy 3: H 3 0 : λ = λ 0 LR 3 R(Y H0 3 = (n r X log (ˆσ 2 λ0 { + sup λ 0 (n r X log ( ˆσ λ 2 + r ( } 1+λ0 µ i ν i log 1+λµ i ( r LR 3 R(Y H0 3 (n r X log Q νi + sup λ 0 { (n r X log ( r 1+λ 0 µ i 1+λµ i Q νi + r ( } 1+λ0 µ i ν i log 1+λµ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 17 / 29

Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Hypotéza 4: H 4 0 : λ = λ 0 a σ2 = σ 2 0 Test podielom vierohodností RLRT hypotézy 4: H 4 0 : λ = λ 0 a σ 2 = σ 2 0 LR 4 R(Y H0 4 = nˆσ2 λ 0 (n r X (1 log(n r X σ 2 0 + sup λ 0 { ( nˆσ 2 (n r X log λ σ 2 0 + r ( } 1+λ0 µ i ν i log 1+λµ i LR 4 R(Y H 4 0 r Q νi (n r X (1 log(n r X + sup λ 0 { (n r X log ( r 1+λ 0 µ i 1+λµ i Q νi + r ( } 1+λ0 µ i ν i log 1+λµ i V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 18 / 29

Odvodenie exaktného nulového rozdelenia štatistík LRT/RLRT Pravdepodobnost nulového odhadu ML/REML parametra λ Pr(ˆλ ML = 0 λ 0 & Pr(ˆλ REML = 0 λ 0 Označme f LRT (λ λ 0 = f RLRT (λ λ 0 = { ( r 1+λ 0 µ i s ( } 1+λ0 ξ i n log Q νi + ν ξi log 1+λµ i 1+λξ i { ( r 1+λ 0 µ i r ( } 1+λ0 µ i (n r X log Q νi + ν i log 1+λµ i 1+λµ i Potom ˆλ ML = arg sup λ 0 {f LRT (λ λ 0 }, a ˆλ REML = arg sup λ 0 {f RLRT (λ λ 0 }. Podmienenú pravdepodobnost toho, že ML/REML odhad parametra λ bude 0 pokial skutočný parameter je λ 0, možno odhadnút : ( flrt (λ λ 0 Pr(ˆλ ML = 0 λ 0 Pr λ=0 0 λ ( r = Pr (µ i ξ(1+λ 0 µ iq νi 0 kde ξ = 1 n ( r Pr(ˆλ REML = 0 λ 0 Pr (µ i µ(1+λ 0 µ iq νi 0 s ν ξ i ξ i a µ = 1 r n r X νiµi. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 19 / 29

Štandard asymptotické aproximácie Za predpokladu, že požadované predpoklady platia a testovaná hodnota λ 0 je vo vnútri parametrického priestoru, t.j. λ 0 > 0, štandardnou asymptotickou aproximáciou nulového rozdelenia danej LRT/RLRT štatistiky pre dostatočne vel ký rozsah výberu je D LR(Y H 0 χ 2 d, kde d je počet reštrikcií na parametre modelu. Pre λ 0 na hranici parametrického priestoru, t.j. λ 0 = 0, Stram and Lee (Biometrics 1994 navrhli aproximáciu nulového rozdelenia danej LRT/RLRT štatistiky pre dostatočne vel ký rozsah výberu ako zmes rozdelení LR(Y H 0 kde d je počet reštrikcií na parametre modelu. D 0.5χ 2 d 1 : 0.5χ 2 d, Pinheiro and Bates (2000 navrhli aproximáciu nulového rozdelenia danej LRT/RLRT štatistiky pre λ 0 na hranici parametrického priestoru ako zmes rozdelení s rozdielnými váhami: LR(Y H 0 kde d je počet reštrikcií na parametre modelu. D 0.65χ 2 d 1 : 0.35χ 2 d, V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 20 / 29

Empirická evidencia Vlastnosti exaktného nulového rozdelenia LRT/RLRT štatistík budeme ilustrovat na špecifickom príkalde: Uvažujme model Y = Xβ + Zu +ε, Uvažujeme tu model vhodný pre výbery z dvoch populácií s rôznym počtom výberových jednotiek (m 1, m 2, tu m = m 1 + m 2 = 5+7 = 12 výberových jednotiek (subjektov, pričom na subjekte i máme T i opakovaných pozorovaní v rôznych časoch, T i {1, 3, 3, 6, 9} pre prvú populáciu, a T i {3, 5, 9, 11, 5, 4, 3} pre druhú populáciu. Pozorovania Y, modelujeme ako Y = [X 1, X 2 ](β 1,β 2, kde Y je n = m Ti = 62 dimenzionálny vektor, X 1 reprezentuje s vysvetl ujúcu premennú (funkciu času a stĺpce X 2 reprezentujú pomocné (dummy premenné pre rozlíšenie dvoch populácií. Teda β 1 je skalár, a β 2 je 2-rozmerný vektor. V tomto modeli uvažujeme ako H 1,2 0 hypotézu, že β 1 = 0. Odozva Y bola modelovaná pomocou modelu s náhodnými koeficientami (intercepts, s (n m maticou Z plnej hodnosti, kde stĺpce reprezentovali pomocné premenné pre m výberových jednotiek (subjektov, t.j. V = ZZ, pričom r V = 12, teda pomocou LMM s dvomi variančnými komponentami. Viac podrobnosti o štruktúre daného modelu možno nájst v práci Volaufová and Witkovský (TMMP 2012. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 21 / 29

Empirická evidencia LRT hypotézy 1: H 1 0 : θ = θ 0 a λ = λ 0 1 LRT of Hypothesis 1: H 0 : Xβ = Xβ 0 & λ = λ 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 1 (Y H 0 1 pre rôzne hodnoty λ 0, pričom h = r H = 1. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: (i zmes rozdelení 0.5χ 2 (h : 0.5χ 2 (h + 1 a rozdelením χ 2 (h + 1, (ii zmes rozdelení wχ 2 (h : (1 wχ 2 (h + 1, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality h+1,δ δ = 0.45. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 22 / 29

Empirická evidencia LRT hypotézy 1: H 1 0 : θ = θ 0 a λ = λ 0 1 LRT of Hypothesis 1: H 0 : Xβ = Xβ 0 & λ = λ 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 1 (Y H 0 1 pre rôzne hodnoty λ 0, pričom h = r H = 1. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: (i zmes rozdelení 0.5χ 2 (h : 0.5χ 2 (h + 1 a rozdelením χ 2 (h + 1, (ii zmes rozdelení wχ 2 (h : (1 wχ 2 (h + 1, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality h+1,δ δ = 0.45. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 22 / 29

Empirická evidencia LRT hypotézy 1: H 1 0 : θ = θ 0 a λ = λ 0 1 LRT of Hypothesis 1: H 0 : Xβ = Xβ 0 & λ = λ 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 1 (Y H 0 1 pre rôzne hodnoty λ 0, pričom h = r H = 1. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: (i zmes rozdelení 0.5χ 2 (h : 0.5χ 2 (h + 1 a rozdelením χ 2 (h + 1, (ii zmes rozdelení wχ 2 (h : (1 wχ 2 (h + 1, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality h+1,δ δ = 0.45. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 22 / 29

Empirická evidencia LRT hypotézy 2: H 2 0 : θ = θ 0 a λ = λ 0 a σ 2 = σ 2 0 1 LRT of Hypothesis 2: H 0 : Xβ = Xβ 0 & λ = λ 0 & σ 2 = σ 2 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 2 (Y H 0 2 pre rôzne hodnoty λ 0, pričom h = r H = 1. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: zmes rozdelení wχ 2 (h + 1 : (1 wχ 2 (h + 2, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality δ = 0.45. h+2,δ V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 23 / 29

Empirická evidencia LRT hypotézy 3: H 3 0 : λ = λ 0 1 LRT of Hypothesis 3: λ = λ 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 3 (Y H 3 0 pre rôzne hodnoty λ 0. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: zmes rozdelení wχ 2 (0 : (1 wχ 2 (1, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality δ = 0.45. 1,δ V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 24 / 29

Empirická evidencia LRT hypotézy 4: H 4 0 : λ = λ 0 a σ 2 = σ 2 0 1 LRT of Hypothesis 4: H 0 : λ = λ 0 & σ 2 = σ 2 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 4 (Y H 4 0 pre rôzne hodnoty λ 0. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: zmes rozdelení wχ 2 (1 : (1 wχ 2 (2, kde w = Pr(ˆλ ML = 0 λ 0 = 0 = 0.7362 a necentrálnym rozdelením χ 2 s odhadnutým parametrom necentrality δ = 0.45. 2,δ V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 25 / 29

Empirická evidencia RLRT hypotézy 3: H 3 0 : λ = λ 0 1 RLRT of Hypothesis 3: λ = λ 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 3 R (Y H3 0 pre rôzne hodnoty λ 0. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: zmes rozdelení wχ 2 (0 : (1 wχ 2 (1, kde w = Pr(ˆλ REML = 0 λ 0 = 0 = 0.5635 a centrálnym rozdelením χ 2 1. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 26 / 29

Empirická evidencia Test podielom vierohodností RLRT hypotézy 4: H 4 0 : λ = λ 0 a σ 2 = σ 2 0 1 RLRT of Hypothesis 4: H 0 : λ = λ 0 & σ 2 = σ 2 0 0.9 0.8 0.7 0.6 CDF 0.5 0.4 0.3 0.2 0.1 0 0 5 10 15 LRT Obr.: Exaktné a približné nulové rozdelenia štatistiky LR 3 R (Y H3 0 pre rôzne hodnoty λ 0. Tenké čiary zobrazujú exaktné CDF pre λ 0 = 0 : 0.05 : 1 (zl ava. Hrubé čiary zobrazujú aproximácie: zmes rozdelení wχ 2 (1 : (1 wχ 2 (2, kde w = Pr(ˆλ REML = 0 λ 0 = 0 = 0.5635 a centrálnym rozdelením χ 2 2. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 27 / 29

Neštandardné asymptotické aproximácie Špeciálne prípady Exaktné nulové rozdelenie LR/RLRT štatistík závisí na vlastných číslach µ i,n a ξ j,n matíc modelu pre n-rozmerný vektor Y. Pre testovanie hypotéz H 1 0 a H 3 0, pričom λ 0 = 0, Crainiceanu and Rupert (2004 navrhli asymptotickú aproximáciu, založenú na predpokladoch: Nech rank(v = r V je pevne daná a nech µ i,n lim n lim n n γ ξ i,n n γ pre nejaké γ 0. Potom r LR 1 (Y H0 1 D Q rh + sup λ 0 r LR 3 (Y H0 3 D sup λ 0 { r LRR(Y 3 H0 3 D sup λ 0 = µ i, = ξ i, λµ i, 1+ λµ i, Q νi λµ i, 1+ λµ i, Q νi λµ i, 1+ λµ i, Q νi s ν ξj log(1+ λξ j, j=1 s ν ξj log(1+ λξ j,, j=1 } r ν µi log(1+ λµ i,. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 28 / 29

Neštandardné asymptotické aproximácie Vyvážený ANOVA model jednoduchého triedenia s náhodnými efektami Pre ilustráciu uvažujme vyvážený ANOVA model jednoduchého triedenia s náhodnými efektami, s K úrovňami a J pozorovaniami pre každú úroveň. Potom, n = KJ, rank(v = r V = K a zodpovedajúce vlastné čísla sú µ 0,n = 0 s násobnost ou ν µ,0 = n K, µ 1,n = J s násobnost ou ν µ,1 = K 1, ξ 1,n = 0 s násobnost ou ν ξ,1 = n K, ξ 2,n = J s násobnost ou ν ξ,1 = K. Za platnosti nulovej hypotézy H0 3 : λ 0 = 0 exaktné rozdelenie RLRT štatistiky LR 3 R (Y H3 0 je { ( } LRR(Y 3 H0 3 QK 1 n log(q K 1 +Q n K + inf n log λ 0 1+λJ + Q n K K log(1+λj Crainiceanu and Rupert (2004 navrhli asymptotickú aproximáciu rozdelenia pre J a konštantnú hodnotu K ako LR 3 R(Y H 3 0 D {(Q K 1 K K log(q K 1 /K} I(Q K 1 > K, Toto asymptotické rozdelenie má v nule hodnotu rovnú Pr(Q K 1 < K. V. WITKOVSKÝ (ÚM SAV LRT/RLRT & konfidenčné oblasti ROBUST 2012 29 / 29