Modellering av overdispersjon i populasjonsdata
Master thesis
View/ Open
Date
2023-11-20Metadata
Show full item recordCollections
- Master theses [133]
Abstract
I denne studien anvendte vi generaliserte lineære modeller (GLM) for å modellere populasjonsdata fraThe Human Mortality Database (HMD) for Sverige. Dataene ble brukt til å predikere antall døde medalderstrinn og kalenderår som prediktorer. Ved å anta Poisson som responsfordeling for antall døde, viste modellen seg imidlertid å være overdispersert.
For å inkludere mer variasjon i modellen endret vi responsfordeling fra Poisson til negativ binomial. Denne endringen tillot oss å estimere både forventning og dispersjonsparameter, noe som forbedret modellens tilpasning. For å utbedre modellen vår ytterligere benyttet vi simultan modellering av dispersjonsparameter og forventning med Generalized Linear Models using Template Model Builder (glmmTMB). Det viste seg at modellering av dispersjonsparameteren som en log-lineær funksjon av predktorvariabler, hadde god effekt når vi sammenlignet AIC blant modeller med heterogen dispersjonsparameter, opp mot modeller med homogen dispersjonsparameter.
En simuleringsbasert metode fra Diagnostics for Hierarchical Regression Models (DHARMa) ble brukt for å avgjøre hvor godt de ulike modellene forklarte variabiliteten i data. Programvaren ga oss en \\ikke-parametrisk tilnærming som sammenlignet observerte og simulerte residualer. Testing av dispersjon viste at dispersjonsmodellering bidro til å inkludere overdispersjon i modellene, og at utfallet varierte avhengig av hvordan vi definerte prediktoren i dispersjonsmodellen.
Prognoser fra de ulike modellene antydet at modellering av dispersjon bidro til å økt styrke for predikert forventning, og resulterte i lavere dødssannsynligheter når vi knyttet estimert dødelighet opp mot overlevelsesanalyse.