• norsk
    • English
  • English 
    • norsk
    • English
  • Login
View Item 
  •   Home
  • Faculty of Social Sciences
  • Department of Information Science and Media Studies
  • Master theses
  • View Item
  •   Home
  • Faculty of Social Sciences
  • Department of Information Science and Media Studies
  • Master theses
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Generative språkmodeller for automatisert tekstforenkling: Tilpasning av nyhetsartikler for lesbarhet hos personer med dysleksi

Kirkhorn, Thale Knudsen
Master thesis
Thumbnail
View/Open
master thesis (1.573Mb)
vedlegg (86.90Kb)
URI
https://hdl.handle.net/11250/3072352
Date
2023-06-02
Metadata
Show full item record
Collections
  • Master theses [193]
Abstract
I denne masteroppgaven utforskes utviklingen av en prototype for automatisert tekstforenkling med fokus på tilpasning av nyhetsartikler for personer med dysleksi. Prosjektet involverer flere iterasjoner for å finne den mest effektive tilnærmingen for å forenkle tekstene ved hjelp av generative språkmodeller. Prototypen inneholder tre nivåer av forenklet tekst, der nivå null representerer den originale teksten og nivå en til tre gradvis forenkler innholdet. Testing og evaluering av prototypen gjennomføres ved å utføre brukertester med målgruppen og samle tilbakemeldinger fra eksperter innen feltet. Disse tilbakemeldingene er verdifulle i forbedringen av prototypen og tekstforenklingen. En viktig del av arbeidet er eksperimentering med ulike prompts og instruksjoner for å finne den mest effektive måten å be språkmodellen forenkle artiklene på. Observeringer indikerer at formuleringen av promptene har en innvirkning på resultatene, og at det er utfordringer knyttet til språket i de genererte versjonene. Dette vil kreve manuell redigering av tekstene for å oppnå ønsket lesbarhet og kvalitet. Funnene indikerer at språkmodellen fortsatt har begrensninger når det gjelder å generere grammatisk korrekte setninger og å velge passende ord i konteksten ved omformulering av en eksisterende tekst. Videre identifiseres utfordringer knyttet til maksgrensen for tokens, som begrenser promptlengden, artikkellengden og den forenklede teksten. Det er viktig å påpeke at denne forskningen blir gjennomført innenfor de nåværende rammene for språkmodeller for å teste reformulering av norske nyhetsartikler. Med fremtidig utvikling av språkmodeller og økende tokenkapasitet, samt inkorporering av retningslinjer for klarspråk direkte i modellene, kan vi forvente ytterligere forbedringer i automatisert tekstforenkling.
Publisher
The University of Bergen
Copyright
Copyright the Author. All rights reserved

Contact Us | Send Feedback

Privacy policy
DSpace software copyright © 2002-2019  DuraSpace

Service from  Unit
 

 

Browse

ArchiveCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsDocument TypesJournalsThis CollectionBy Issue DateAuthorsTitlesSubjectsDocument TypesJournals

My Account

Login

Statistics

View Usage Statistics

Contact Us | Send Feedback

Privacy policy
DSpace software copyright © 2002-2019  DuraSpace

Service from  Unit