Det forståingsfulle opplysningssystemet Eit studium av BussTUC, med fokus på ambiguitetsrelaterte problem
Abstract
The point of departure for this thesis is the bus route information system BusTUC – a database system with an interface based on input in natural language, i.e. sentences in Norwegian and English. The system was developed in connection to NTNU during 1996 and is now available to the public both on the Internet and per SMS. The thesis discusses problem areas tied to the interface and the language processing part of the system which still remain to be taken care of; first and foremost problems related to disambiguation. Different potential solutions are presented and some of these tried out in practice. The main focus is directed towards the parsing part of the system. The original parser, a built-in Prolog parser working top-down with backtracking, is replaced by a chart parser. The goal is to make a parsing module that leads to better results with regard to ambiguous input, and that works as effective as the original parser. Key words: Natural Language Processing (NLP), ambiguity, chart parsing, Natural Language Interfaces (NLI), extraposition grammar, categorial grammar, Natural Language Interfaces to Databases (NLIBD) Denne hovudfagsoppgåva tek utgangspunkt i bussruteopplysningssystemet BussTUC – eit databasesystem med eit grensesnitt basert på innputt i from av naturleg språk, det vil seie norske og engelske setningar. Systemet vart utvikla i tilknyting til NTNU i løpet av 1996 og er i dag tilgjengeleg via Internett og SMS. Oppgåva tek føre seg problemområde det framleis gjenstår å få bukt med i tilknyting til sjølve grensesnittet og språkprosesseringa; I første rekke problem relaterte til disambiguering. Ulike løysingstilnærmingar vert presenterte og enkelte av desse prøvde ut i praksis. Fokus vert i stor grad retta mot parsingdelen av systemet: Den opprinnelege parsaren, ein innebygd prologparsar som arbeider topp-ned med tilbakesporing, vert bytta ut med ein kartparsar. Målet er å finna ut om ein kartparsingmodul kan føra til betre resultat med omsyn til fleirtydige og ufullstendige innputt, samt om det er mogleg å få han like effektiv som den opprinnelege parsingmodulen. Nøkkelord: Språkprosessering, ambiguitet, kartparsing, naturlegspråklege grensesnitt, ekstraposisjonsgrammatikk, kategorialgrammatikk, databasegrensesnitt baserte på naturleg språk
Publisher
The University of BergenCopyright
Copyright the author. All rights reservedThe author