Negativ binomisk regresjon med modifiserte sannsynligheter for nullobservasjoner; ZINB og ZANB
Abstract
Regresjonsmodeller av Poisson- og negativ binomisk fordeling blir ofte brukt til å utføre regresjonsanalyse på datasett innen medisin, biologi, økonomi og mange andre fagfelt. Det oppstår ofte tilfeller der andelen av verdien null i datasettet ikke samstemmer med den som er forventet når det antas at observasjonene enten er negativ binomisk (NB)- eller Poissonfordelt. Et eksempel på slike kan være antall innrapporterte skademeldinger et år fra en gruppe forsikringstakere, som grunnet egenandel vil inneholde flere observasjoner av null enn forventet. Antall dager en pasient er innlagt på sykehus, der kun innlagte pasienter er tatt med i beregningen, er et annet eksempel på at forventet antall nullobservasjoner ikke vil være lik forventet antall fra NB- eller Poisson fordelte data. Denne oppgaven vil ta for seg to modeller som er laget for å tilpasse datasett som er antatt negativ binomisk fordelt, men som inneholder mange nullobservasjoner i tillegg. Før en introduksjon av disse modellene, er det valgt å inkludere en del teori om negativ binomisk fordelinger og regresjonsmodeller som tar utgangspunkt i disse. Dette vil gi et godt grunnlag for å forstå oppbyggingen i fordelingene bak, og til modellene ZINB og ZANB, når disse deretter vil bli grundig forklart. Til slutt vil det undersøkes om valg av de to modellene er avgjørende for resultat etter tilpassing av ulike datasett, og hvilke konsekvenser bruk av enten ZINB eller ZANB som regresjonsmodell når den andre er den korrekte kan gi. I tillegg vil det vurderes om det generelt er mulig å se hvilken modell som er mest riktig ut ifra egenskaper i det observerte datasettet.