GAMLSS-modeller i bilforsikring
Abstract
I denne oppgaven tester jeg ulike modeller for prediksjon av total skadeutbetaling fra forsikringsselskap til forsikringstaker i et poliseår. Modellene som testes hører til rammeverket Generalized Additive Models for Location, Shape and Scale - GAMLSS - introdusert av Rigby og Stasinopoulos (2001). Data brukt i oppgaven er hentet fra et norsk forsikringsselskap, og består av informasjon om poliser og skader i bilforsikring i årene 2000-2005. Ved hjelp av kun 3 forklaringsvariabler; årstall, bilalder og personalder, viser jeg i denne oppgaven at valg av statistisk modell er avgjørende for prediksjonene av skadeutbetalingen (kapittel 9). Videre tester jeg ut hvordan modellprediksjonene kan brukes til å lage en realistisk prismodell, og hvordan prismodellen gir ulike resultater for de ulike prediksjonsmodellene (kapittel 10). Total skadeutbetaling deles naturlig inn i skadefrekvens og skadepris. Jeg tester i oppgaven både modeller som modellerer disse separat, og modeller som modellerer total skadeutbetaling direkte. Jeg vil argumentere for at de direkte modellene er å foretrekke. Modellen som anbefales er en Zero-Adjusted Inverse Gaussian - ZAIG-modell, der forklaringsvariablenes funksjonelle form er valgt slik at AIC blir så lav som mulig. En ZAIG-fordelt stokastisk variabel tar verdien 0 med sannsynlighet psi og følger en Invers-Gaussisk-fordeling med sannsynlighet (1-psi). Skadepriser er såpass skjevt fordelt at det må en ekstremt skjev sannsynlighetsfordeling, som den Invers-Gaussiske, til, for å beskrive dem. Jeg vil også i oppgaven argumentere for at valg av sannsynlighetsfordeling har stor betydning for kvaliteten på prediksjonene.