The heritability curve and its applications to human non-Mendelian traits
Abstract
Arvbarhet er et viktig mål for å beskrive en ikke-mendelsk egenskap; den måler i hvilken andel verdien av egenskapen påvirkes av genetisk materiale. I klassiske biometriske modeller er arvbarheten konstant over hele egenskapsområdet. Dette blir sett på som for reduktivt i mer moderne tilnærminger. I stedet defineres kontinuerlig arvbarhet, som avhenger av verdien av egenskapen. I dette manuskriptet definerer vi en arvbarhetskurve, et parametrisk mål på arvbarheten, basert på en lokal definisjon av korrelasjon.
Ved å anta at fordelingen som ligger til grunn for dataene er en Gaussian mixture, konstruerer vi en eksplisitt formel for arvbarhetskurven. Vi studerer egenskapene og bruken av den, og bruker den deretter på registerdata fra mennesker.
For å estimere Gaussian mixture parametrene bruker vi en algoritme basert på automatisk differensiering. Det gjør at vi kan beregne derivater raskere og forbedre presisjonen til algoritmen. Vi studerer til slutt en Hamiltonian Monte Carlo-algoritme for å initialisere parametrene i optimaliseringsprosessen. Heritability is an important measure to describe a non-Mendelian trait; it measures in which proportion the value of the trait is affected by genetic material.
In classical biometric models, the heritability is measured as a constant over the entire trait range. A constant heritability is seen as too reductive in more modern approaches, which instead work towards defining a continuous heritability, dependent on the trait value.
In this manuscript we define a heritability curve, a parametric measure of the heritability, based on a local definition of the correlation. Using a Gaussian mixture as the distribution underlying the data, we construct an explicit formula for the heritability curve. We study its properties and its use, applying it then on real human data.
For the estimation of the Gaussian mixture parameters, we use an algorithm based on automatic differentiation. This allows us to compute derivatives faster and improve the precision of the algorithm. We lastly study an Hamiltonian Monte Carlo algorithm to initialize the parameters in the optimization process.
Has parts
Paper I: Berentsen, G. D., Azzolini, F., Skaug, H. J., Lie, R. T., & Gjessing, H. K. (2021). Heritability curves: A local measure of heritability in family models. Statistics in Medicine, 40(6), 1357-1382. The manuscript is available in the thesis. The published article is available at: https://doi.org/10.1002/sim.8845Paper II: Azzolini, F., Berentsen, G. D., Skaug, H. J., Hjelmborg, J. V., & Kaprio, J. A. (2022). The heritability of BMI varies across the range of BMI—a heritability curve analysis in a twin cohort. International Journal of Obesity, 46(10), 1786-1791. The manuscript is available in the thesis. The published article is available at: https://doi.org/10.1038/s41366-022-01172-6
Paper III: Azzolini, F., & Skaug, H. (2023). Exploring the likelihood surface in multivariate Gaussian mixtures using Hamiltonian Monte Carlo. The manuscript is available in the thesis. The manuscript is also available at: https://doi.org/10.48550/arXiv.2308.14700