Show simple item record

dc.contributor.authorSkaugen, Håvar
dc.date.accessioned2016-01-05T12:10:13Z
dc.date.available2016-01-05T12:10:13Z
dc.date.issued2015-11-20
dc.date.submitted2015-11-20eng
dc.identifier.urihttps://hdl.handle.net/1956/10867
dc.description.abstractThis thesis describes a method for generating semantically motivated antecedent candidates for use in pronominal anaphora resolution. Predicate-argument structures are extracted from a large corpus of text parsed by the NorGram grammar and used as the basis for a fuzzy classification model. Given a pronominal anaphor, the model generates antecedent candidates ranked by the frequency by which they co-occur in the same lexical context as the anaphor. This set of candidates is intersected with the set of nouns gathered from the anaphor's recent context. A selection basic heuristics are then introduced to the model in a permutational fashion to gauge their individual and combined effect on the model's accuracy. The model reached an accuracy of 56.22% correct predictions. Additionally, in a slightly modified model the correct antecedent was found within the antecedent candidate list for 87.12% of the anaphora.en_US
dc.description.abstractI denne oppgaven beskriver jeg en metode for å generere semantisk motiverte antesedentkandidater til bruk i anaforoppløsning. Predikat-argument strukturer blir ekstrahert fra et stort korpus med tekst tagget med NorGram-grammatikken og brukt som basis i en "fuzzy" klassifikasjonsmodell. Modellen genererer antesedentkandidater for pronominelle anaforer rangert etter hvilken frekvens de forekommer i samme leksikale kontekst som anaforen. Et snitt blir foretatt mellom dette settet av kandidater og settet av substantiver i anaforens foregående kontekst. Et utvalg enkle heuristikker blir tilført modellen i forskjellige permutasjoner for å måle deres samlede og individuelle effekt på modellens treffsikkerhet. Modellen nådde en treffsikkerhet på 56.22% korrekte klassifiserte antesedenter. For en delvis modifisert versjon av modellen finnes den korrekte antesedenten blant antesedentkandidatene i 87.12% av tilfellene.en_US
dc.format.extent710198 byteseng
dc.format.mimetypeapplication/pdfeng
dc.language.isoengeng
dc.publisherThe University of Bergeneng
dc.subjectanaphora resolutioneng
dc.subjectsemanticseng
dc.subjectreal-world knowledgeeng
dc.subjectanaphoraeng
dc.subjectantecedentseng
dc.titleSemantics driven anaphora resolutioneng
dc.typeMaster thesis
dc.rights.holderCopyright the author. All rights reservedeng
dc.description.degreeMaster i Datalingvistikk og språkteknologi
dc.description.localcodeMAHF-DASP
dc.description.localcodeDASP350
dc.subject.nus711726eng
fs.subjectcodeDASP350


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record