Michal Páleš Panjerove rekurentné vzťahy v prostredí jazyka R Michal Páleš PANJEROVE REKURENTNÉ VZŤAHY V PROSTREDÍ JAZYKA R Úvod Na vyjadrenie rozdele

Podobné dokumenty
Algoritmizácia a programovanie - Príkazy

MO_pred1

Hospodarska_informatika_2015_2016a

Generovanie viacstavových modelov a ich riešenie v Maxime 1 Jozef Fecenko Abstrakt Cieľom príspevku je prezentovať zdrojový kód v open source systéme

SRPkapitola06_v1.docx

Teória pravdepodobnosti Zákony velkých císel

Podpora metód operačného výskumu pri navrhovaní systému liniek doc. RNDr. Štefan PEŠKO, CSc. Katedra matematických metód, Fa

Simanova.Barbora

Snímka 1

APROXIMÁCIA BINOMICKÉHO ROZDELENIA NORMÁLNYM A PRÍKLAD JEJ APLIKÁCIE V AKTUÁRSTVE S VYUŽITÍM JAZYKA R Abstrakt Príspevok sa zameriava na prezentáciu l

Tue Oct 3 22:05:51 CEST Začiatky s jazykom C 2.1 Štruktúra programu Štruktúra programu by sa dala jednoducho popísať nasledovnými časťami, kto

Študijný program (Študijný odbor) Školiteľ Forma štúdia Téma Elektronické zbraňové systémy (8.4.3 Výzbroj a technika ozbrojených síl) doc. Ing. Martin

NSK Karta PDF

O možnosti riešenia deformácie zemského povrchu z pohladu metódy konecných prvkov konference pro studenty matematiky

Siete vytvorené z korelácií casových radov

NSK Karta PDF

PowerPoint Presentation

Pacakova.Viera

Platný od: OPIS ŠTUDIJNÉHO ODBORU

Prezentácia programu PowerPoint

Paralelné algoritmy, cast c. 2

Študijný program (Študijný odbor) Školiteľ Forma štúdia Téma Požiadavky na prijatie Výzbroj a technika ozbrojených síl (8.4.3 Výzbroj a technika ozbro

1

ODPORÚČANÉ ŠTUDIJNÉ PLÁNY PRE ŠTUDENTOV DENNÉHO A EXTERNÉHO ŠTÚDIA 1 Študijný program 1. stupňa: Ekonomika a manažment podniku Študijný odbor:

Snímka 1

Matematický model činnosti sekvenčného obvodu 7 MATEMATICKÝ MODEL ČINNOSTI SEKVENČNÉHO OBVODU Konečný automat predstavuje matematický model sekvenčnéh

VZTAH STUDENTŮ VŠ K DISCIPLÍNÁM TEORETICKÉ INFORMATIKY

2.5. Dotyčnica krivky, dotykový kužeľ. Nech f je krivka a nech P V (f) (t.j. m P (f) 1). Ak m P (f) = r a l je taká priamka, že I P (f, l) > r, potom

NÁVRH UČEBNÝCH OSNOV PRE 1

Modelovanie nového produktu na trhu: Bassov model Beáta Stehlíková Cvičenia z časových radov, FMFI UK Modelovanie nového produktu na trhu: Bassov mode

Matematika 2 - cast: Funkcia viac premenných

Detekcia akustických udalostí v bezpečnostných aplikáciách

WP summary

III. Diferenciálny počet funkcie viac premenných (Prezentácia k prednáškam, čast B) Matematická analýza IV (ÚMV/MAN2d/10) RNDr. Lenka Halčinová, PhD.

Pokrocilé programovanie II - Nelineárne iteracné schémy, chaos, fraktály

Čo sa skrývalo za aftóznou stomatitídou

E K O N O M I C K Á U N I V E R Z I TA V B R A T I S L A V E

03_ControlFlow.dvi

Cvičenie 9 Riešené príklady 1. Príklad min f(x 1, x 2 ) = x x x 1 s.t. x 1 80 x 1 + x Pre riešenie úlohy vykonáme nasledujúce kroky

Základné východiska kvantitativneho modelovania rizika

PM C-03 Prostredie riadenia ¾udských zdrojov

17. medzinárodná vedecká konferencia Riešenie krízových situácií v špecifickom prostredí, Fakulta špeciálneho inžinierstva ŽU, Žilina, máj 2

News Flash 25. augusta, 2015 Zabezpečenie stravovania pre zamestnancov

Microsoft PowerPoint - OOP_prednaska_10.pptx

Microsoft Word - Hitka - esej2011_06-is-xhitka.doc

Operačná analýza 2

DediĊnosť

Microsoft Word - RolyRiadeniaZmien_V1.doc

Digitálne technológie v každodennom živote 3. ročník akademický rok 2019/2020 Harmonogram prednášok

gis5 prifuk

Manažment v Tvorbe Softvéru 2018/2019

N Á R O D N Á R A D A S L O V E N S K E J R E P U B L I K Y VI. volebné obdobie Návrh Zákon z , ktorým sa mení a dopĺňa zákon č. 580/2004 Z. z.

Pokyny_Doctorandorum dies

Microsoft Word - Argumentation_presentation.doc

Slide 1

Princípy tvorby softvéru Programovacie paradigmy

Neineárne programovanie zimný semester 2018/19 M. Trnovská, KAMŠ, FMFI UK 1

User:tomas.melicher

nadpis

4. Pravidlo ret azenia. Často sa stretávame so skupinami premenných, ktoré zložitým spôsobom závisia od iných skupín premenných. Pravidlo ret azenia p

PARAMETRE RHO A VEGA PRE FORWARD-START OPCIE Marek Ďurica ÚVOD Nakoľko časový vývoj cien aktív je nestály a sú možné aj prudké poklesov cien aktív, je

enum

Používateľská príručka POUŽÍVATEĽSKÁ PRÍRUČKA Generátor XML dávok pre Informačný systém kontrolných známok z MS Excel šablóny Dátum: Verzia

A Evidenčné číslo projektu Project ID Dátum podania Date of submission Názov projektu Project title Akronym projektu Acronym of the proje

Príloha k rozhodnutiu č. CD / :071 Priznanie práva udeľovať absolventom jednotlivých študijných programov príslušné akademické tituly

ISO Systémy manažérstva proti korupcii Svetový deň normalizácie 2018 Miroslav HRNČIAR Žilinská univerzita v Žiline

Vyhodnotenie študentských ankét 2013

Centrum vedecko-technických informácií, Odbor pre hodnotenie vedy, Oddelenie pre hodnotenie publikačnej činnosti Vyhľadávanie a práca so záznamami - C

1

Zápisnica č

Terek Milan

OPIdS - finančné riadenie

Microsoft Word - 06b976f06a0Matice - Uzivatelska Dokumentacia

Prenosový kanál a jeho kapacita

Uctovnictvo_2015_2016a

ECDL Syllabus V50 SK-V01

Photo Album

Prezentace aplikace PowerPoint

Prevádzka

Trendy a inovatívne prístupy v podnikových procesoch 2017, roč. 20 Trends and Innovative Approaches in Business Processes 2017, Vol. 20 ŽIVOTNÝ CYKLUS

Základné informácie k papierovej forme testovania žiakov 5. ročníka ZŠ T September 2016 NÚCEM, Bratislava 2016

PowerPoint Presentation

SLOVENSKÁ NÁRODNÁ AKREDITAČNÁ SLUŽBA Karloveská 63, P. O. Box 74, Bratislava 4 Politika PL 27 POLITIKA SNAS NA AKREDITÁCIU ORGANIZÁTOROV SKÚŠOK

Platný od: OPIS ŠTUDIJNÉHO ODBORU KVANTITATÍVNE METÓDY V EKONÓMII

Chemical Business NewsBase

Brezina_Gertler_Pekar_2005

Externé mediálne karty Používateľská príručka

Autoregresné (AR) procesy Beáta Stehlíková Časové rady, FMFI UK Autoregresné(AR) procesy p.1/22

Použitie počítačov (1)

ECTS Course Catalogue st Level of University Education (Bc.) 1. Stupeň štúdia (Bc.) Study programme/ Študijný program: Management of Securi

Analýza hlavných komponentov

Šablona dokumentu

1

Microsoft Word - o09_Používateľská príručka ku kontrole kupónov na webe_v4.doc

Milé študentky, milí študenti, v prvom rade Vám ďakujeme za vyplnenie ankety. Táto anketa bola zameraná na zistenie Vášho postoja ku kvalite materiáln

Kolégium dekana

TECHNICKÁ UNIVERZITA VO ZVOLENE Centrálne pracovisko Študijný program: Ekonomika a manažment lesnícko-drevárskeho komplexu Študijný odbor: Stupeň štúd

Models of marital status and childbearing

Prepis:

PANJEROVE REKURENTNÉ VZŤAHY V PROTREDÍ JAZYKA R Úvod Na vyjadrenie rozdelenia celkovej škody existuje v rámci aktuárskych techník množstvo postupov numerické, aproximatívne, simulačné a rekurentné. V príspevku sa budeme teda venovať práve poslednej uvedenej metóde rekurentným vzťahom, ktoré napr. oproti využitiu konvolúcií disponujú značnou efektivitou výpočtu. Rekurentné vzťahy a ich využitie v aktuárskej oblasti, ich vývoj, triedy, úskalia použitia môžeme nájsť vo viacerých publikáciách. Za hlavného priekopníka v tejto oblasti považujeme kanadského aktuára H. H. Panjera (1981). V dôsledku Panjerových publikácií sa rekurentnými vzťahmi v aktuárskej oblasti začalo zaoberať mnoho ďalších autorov. Vytváranie programových aplikácií (nakoľko numerické manuálne riešenie je značne náročné) s využitím rekurentných vzťahov, napríklad v prostredí M Excel (VBA) tiež nie je jednoduché. Príspevok je teda zameraný na ukážku výpočtu pravdepodobnosti rozdelenia celkovej škody v prostredí jazyka R. R je voľne dostupný (open source) jazyk využívaný najmä v akademickej a vedeckej sfére. Ide o program, špecializovaný predovšetkým na štatistické výpočty, kde v štandardnej distribúcii, poprípade v podporných balíčkoch (packages) je implementované veľké množstvo pokročilých štatistických funkcií. Rovnako môže používateľ vytvárať vlastné programy s využitím programovacej funkcionality tohto jazyka. V kontexte s cieľom príspevku sme obmedzili vysvetľovanie základnej teórie v úvodných častiach príspevku na minimum. 1 PANJEROVE REKURENTNÉ VZŤAHY PRE POČET ŠKÔD Ak počet škôd sa riadi diskrétnym rozdelením s nezápornými celočíselnými hodnotami patriacimi do triedy, ktorú Panjer označil ( a, b, 0). Pravdepodobnostná funkcia p N (n) je potom vyjadrená pomocou Panjerovho vzťahu pre počet škôd b pn ( n) a pn ( n 1), n 1,2,3,... (1) n ak existujú konštanty a, b R, pričom začiatočná hodnota pre rekurentný výpočet hodnôt náhodnej premennej N opisujúcej počet škôd je hodnota p N (0), pn (0) 0. Jediné diskrétne rozdelenia, nadobúdajúce nezáporné celočíselné hodnoty, ktoré vyhovujú vzťahu (1) sú Poissonovo, binomické, negatívne binomické rozdelenie a jeho špeciálny prípad geometrické rozdelenie. Napríklad konštanty a, b, ak N Po( ), odvodíme na základe 87

porovnania dvoch po sebe idúcich hodnôt pravdepodobnostnej funkcie Poissonovho rozdelenia. A dostávame (pre dôkaz viď [3]) a 0, b 2 PANJEROVE REKURENTNÉ VZŤAHY PRE CELKOVÚ ŠKODU Panjerov rekurentný vzťah, vyjadrujúci zložené rozdelenie celkovej škody, možno využiť, ak počet škôd sa riadi diskrétnym rozdelením, ktoré patrí do jednotlivých tried vyhovujúcich Panjerovmu rekurentnému vzťahu, ktoré sme uviedli v časti 1 a individuálna výška škody je tiež diskrétna náhodná premenná (označme X) s pravdepodobnostnou funkciou px ( x ). Ak pre náhodnú premennú popisujúcu celkovú škodu, platí potom vzťah pre pravdepodobnostnú funkciu rozdelenia celkovej škody p ( x) má tvar (podľa [3]) (2) (3) Vzťah (3) je Panjerov rekurentný vzťah na výpočet funkčných hodnôt pravdepodobnostnej funkcie zloženého rozdelenia s počtom škôd vyhovujúcim rozdeleniam patriacich do triedy ( a, b, 0) s počiatočnou podmienkou Ak N Po( l ) potom vzťah (3) má tvar (4) (5) a pre počiatočnú podmienku platí p (0) e (6) 88

3 PRAKTICKÁ UKÁŽKA VYUŽITIA PANJEROVÝCH REKURENTNÝCH VZŤAHOV Uvažujme situáciu, že počet škôd sa riadi Poissonovým rozdelením N Po (4) a výška individuálnej výšky škody (v modelových jednotkách) je daná pravdepodobnostnou tabuľkou x 1 2 3 px ( x ) 0,25 0,50 0,25 1 Určme zložené Poissonovo rozdelenie CoPo(4; px ( x )) s využitím vzťahu (5). Ak N Po (4) potom pre konštanty a a b platí a 0, b 4 Potom pre prvé štyri hodnoty pravdepodobnostnej funkcie rozdelenia celkovej škody p ( x ) platí a tak ďalej. 89

4 REALIZÁCIA VÝPOČTU V JAZYKU R Na výpočet sumy vo vzťahu (5), by sme mohli použiť cyklus, ale pretože R je interpretovaný jazyk, je vhodné vektorizovať výpočty a tak nahradiť cyklus funkciou sum. Pri numerickom výpočte, podľa vzťahu (5), sme si mohli všimnúť opakujúce sa hodnoty x, ktoré vlastne ovplyvňujú tri vektory kde m min { x, r} ( 1,...,m) ( px (1),..., px ( m) ) ( p ( x- 1),..., p ( x- m) ) =, pričom r je maximálny index pre ktorý p r > 0. Program pre využitie Panjerových rekurentných vzťahov v situácii, ktorá je definovaná príkladom uvedeným v predchádzajúcej časti príspevku, môžeme písať nasledovne Panjer.Poisson <- function (p, lambda) { if(sum(p)>1 any(p<0)) stop("p parameter not a density") if(lambda * sum(p) > 727) stop ("Underflow") cumul <- f <- exp(-lambda * sum(p)) r <- length(p) x <- 0 repeat { x <- x+1 m <- min(x, r) last<-lambda / x * sum(1:m * head(p,m) * rev(tail(f,m))) f <- c(f,last) cumul <- cumul + last if (cumul > 0.99999999) break } return(f) } Panjer.Poisson(c(0.25,0.5,0.25), 4) pp <- Panjer.Poisson(c(0.25,0.5,0.25), 4) Pri písaní programu sme ponechali ekvivalenty pri definovaní objektov a pomocných textov v anglickom jazyku. Z dôvodu označenia pravdepodobnostných funkcií px ( x ), p ( x ) a následnej nejednoznačnosti bez uvedenia dolných indexov, sme tieto označili ako p, f. yntax programu vypíše preddefinované chybové hlásenie v prípade ak px ( x ) > 1 resp. px ( x ) < 0 90

Označenie lambda, pričom hodnota parametra nemôže byť príliš vysoká. Výpočtový problém (označovaný v angl. ako underflow; pretečenie ) v oblasti stanovenia hodnoty parametra nastáva (v štandardných systémoch M Windows), ak nakoľko hodnota p (0) je potom príliš malá. R využíva pri výpočtoch 64-bit presnosť, ale pri systémoch s 80-bit možno uvažovať pri analýze portfólia aj s parametrom = 11340, kde počiatočná hodnota p (0) 10 5000. V starších programovacích jazykoch (48-bit) tento problém už vznikal, ak (1 px (0)) 88. Napríklad pre n rozmerné portfólia životného poistenia (ak p N (0) = 0, 005) dochádza k tomu javu, ak n = 17600. týmto problémom sa možno vysporiadať využitím kompilovaného externého kódu, ktorý využíva rozšírenie pre spresnenie výpočtov. Tento spôsob môže napríklad pomôcť eliminovať numerickú nestabilitu pri zloženom binomickom rozdelení (viac viď problematika nestability rekurentných vzťahov zloženého binomického rozdelenia). Vstupné hodnoty (pravdepodobnosti px ( x) a parameter ) používateľ zadáva ako argument funkcie Panjer.Poisson(...). Objekt pp potom definuje výsledok riešenia a teda predstavuje vektor, ktorého zložky sú jednotlivé hodnoty pravdepodobnostnej funkcie p ( x ), teda pričom pre w platí ( (0), (1),..., ( )) p = p p p w Pre výstup konkrétnej hodnoty x môžeme využiť zápis pp[x], pričom platí pp[1] = p (0), a tak ďalej. Potom pre hodnoty pp[1] až pp[4]dostávame výsledok identický s výpočtom v časti 3, a to 0.01831564, 0.01831564, 0.04578910, 0.05799952 Je zrejmé, že výsledkom funkcie sum(pp)je hodnota 1. Graf rozdelenia pravdepodobnosti celkovej škody dostávame po zadaní príkazu plot(pp, xlab= Hodnota ), viď obrázok 1. Výpočet hodnôt pravdepodobnosti zloženého rozdelenia celkového počtu škôd možno komparatívne určiť aj pomocou iných metód napríklad pomocou rýchlej Fourierovej transformácie. Na výpočet je možné rovnako využiť prostredie jazyka R, ktorý tu disponuje zabudovanou funkciou fft. Výpočet s využitím rýchlej Fourierovej transformácie sa tým stáva v mnohých prípadoch jednoduchší a celkovo dynamickejší ako 91

pri využití Panjerových rekurentných vzťahov. Problematika výpočtu si však vyžaduje naštudovanie pokročilého teoretického aparátu. Obrázok 1: Graf pravdepodobnostnej funkcie p ( x ) Záver Panjerov rekurentný vzťah sa využíva najmä v prípade ak počet škôd sa štandardne riadi vyhovujúcim diskrétnym rozdelením triedy, pričom náhodná premenná individuálna výška škody je diskrétna. Zvyčajne je v tomto prípade určená pravdepodobnostnou tabuľkou bez špecifikácie rozdelenia tzn. ku každej hodnote individuálnej výšky škody je priradená pravdepodobnosť. V prípade, že výška škody sa riadi konkrétnym spojitým rozdelením pravdepodobnosti s príslušnými parametrami využíva sa napríklad metóda diskretizácie spojitej individuálnej výšky škody. Výpočet hodnôt pravdepodobnostnej funkcie rozdelenia celkovej škody pomocou Panjerových vzťahov je veľmi účinné a jeho význam v aktuárskych výpočtoch ho stavia na popredné miesto (pozornosť je potrebné venovať tiež stabilite týchto algoritmov). Metóda výpočtu, aj napriek tomu, že má výhodu, že netreba priamo počítať konvolúcie, si vyžaduje počítačovú realizáciu. Tu sme využili a popísali jazyk R ako účinný nástroj pre túto realizáciu a rovnako sme uviedli aj viaceré úskalia, ktoré môžu pri programovaní resp. výpočte nastať. Kľúčové slová jazyk R, aktuárske analýzy, teória rizika v poistení, rekurentné vzťahy, Panjerove rekurentné vzťahy 92

Klasifikácia JEL G22; C63 LITERATÚRA [1] KAA, R. GOOVAERT, M. DHAENE, J. DENUIT, M. 2008. Modern actuarial risk theory using R. Berlin : pringer, 2008. IBN 978-3-642-03407-7. [2] KLUGMAN,. A. PANJER, H. H. WILLMOT, G. E. 2009. Loss Models (From Data to Decision). New York : John Wiley ons, 2009. IBN 978-0-470-48744-0. [3] PÁLEŠ, M. 2012. Rekurentné vzťahy pre aktuárov a ich aplikácia v oblasti zaistenia : dizertačná práca. Bratislava : Ekonomická univerzita v Bratislave, 2012. [4] PÁLEŠ, M. 2010. Teória rizika a jej aplikácia v rozhodovacích procesoch komerčných poisťovní. In IMEA 2010 : 10th international conference of postgraduate students and young scientists in informatics, management economics and administration, eč, Chrudim 26th-27th April, 2010. Pardubice : Univerzita Pardubice, 2010. IBN 978-80-7395-254-9. REUMÉ Matematicko-štatistické modely sú dôležitým nástrojom analýzy poistných rizík a významne podporujú všetky procesy v tvorbe vývoja produktov v komerčných poisťovniach. rámcom smernice olvency II sa teória rizika stáva dôležitým nástrojom pre tvorbu aktuárskych modelov, ktoré sú oporným prostriedkom pre manažment poisťovní. Zavádzanie rôznych modelovacích techník otvára široké možnosti aplikácie postupov a metód teórie rizika, a to najmä využitie pravdepodobnostných rozdelení v poisťovníctve individuálnych poistných plnení a následne celkovej škody, v súvislosti s tvorbou poistných modelov s podporou výpočtovej techniky. Príspevok prezentuje programovú aplikáciu v jazyku R, ktorá môže byť využitá pre výpočet hodnôt pravdepodobnostnej funkcie rozdelenia celkovej škody, ak počet škôd má napr. Poissonovo rozdelenie s daným parametrom a individuálna výška škody je diskrétna daná pravdepodobnostnou tabuľkou, s využitím Panjerových rekurentných vzťahov. Uviedli sme odvodené Panjerové rekurentné vzťahy pre počet škôd aj celkovú škodu danej triedy. Tieto vzťahy aplikujeme najskôr pre ukážku manuálneho výpočtu a následne pomocou napísaného programu v jazyku R. Rovnako sa zaoberáme výpočtovými obmedzeniami, ktoré sú s touto problematikou spojené. Vytvorenie kvalitného a spoľahlivého aktuárskeho modelu (scenára), opierajúceho sa o pevný matematicko-štatistický základ, môže poisťovni zabezpečiť značnú konkurenčnú výhodu pri tvorbe nového produktu. Nájsť však presný model rozdelenia pravdepodobnosti celkových škôd pri rôznych druhoch poistenia je často komplexná a náročná úloha. Preto je dôležité snažiť sa hľadať jednoduchšie metódy a v čo najväčšej miere zapájať do tohto systému výpočtovú techniku. Jedným z takýchto zjednodušení, ako sme ukázali, je aplikácia Panjerových rekurentných vzťahov a jazyka R. 93

UMMARY Mathematical-statistical models are important tools for analysis of insurance risk. With olvency II project, the risk theory becomes an important tool for the creation of insurance models. Implementation of various modelling techniques opens up wide possibilities of application procedures and methods of risk theory, mainly use of probability distribution in the individual risk model and then collective risk model in connection with the generation of insurance models to support computer technology. The aim of paper is presentation of application in R language. It can be used to calculate a probability distribution of total claim consider a compound Poisson distribution with parameter lambda and individual claim is discrete with implementing Panjer s recursion. We introduced derived relations for the number of claims and the total claims. Recursions apply for manually calculation at first and then for calculation with written program in language R. Further discuss about computational constraints that are associated with Panjer s recursion. Creating a significant and reliable actuarial model (scenario), based on a solid mathematical and statistical apparatus, can be providing a significant competitive advantage in the development of new product for insurance company. Find the exact model of the probability distribution of the total claims in different types of insurance is complex and challenging task. It is important to apply easier methods and use PC systems. We showed the application and connection Panjer s recursion and language R. Kontakt Ing., PhD., Katedra matematiky a aktuárstva, Fakulta hospodárskej informatiky Ekonomická univerzita v Bratislave, Dolnozemská cesta 1/b, 852 35 Bratislava, tel.: +421 2/672 95 841, e-mail: pales.euba@gmail.com 94