Ut med adamsslekt og inn med arveprinsesse? Leksikografiske metodar i revisjonen av Bokmålsordboka og Nynorskordboka
Conference lecture
Published version
Permanent lenke
https://hdl.handle.net/1956/21288Utgivelsesdato
2019-06-06Metadata
Vis full innførselSamlinger
Sammendrag
Ut med adamsslekt og inn med arveprinsesse? Leksikografiske metoder i Revisjonsprosjektet for Bokmålsordboka og Nynorskordboka I dette innlegget presenteres kildematerialet, verktøy og metoder som brukes og utvikles i det norske Revisjonsprosjektet for Bokmålsordboka og Nynorskordboka. I dette prosjektet skal leksikografene revidere to eksisterende ordbøker parallelt, én på bokmål og én på nynorsk. Hvordan kan leksikografene jobbe effektivt, klokt og etterrettelig for å peke ut et modernisert og relevant ordtilfang i begge målformene? På den ene siden bruker vi de vitenskapelige Språksamlingene ved Universitetet i Bergen. På den andre siden bruker vi søkeverktøy for å analysere tekst på ord- og setningsnivå. Vi vil vise hvordan tekstkorpus er en god empirisk kunnskapskilde når det gjelder lemmatilfang, fraser og flerordsuttrykk, ordbetydninger, den syntaktiske oppførselen til ord og brukseksempler. Vi vil samtidig vise eksempler hvor korpus potensielt også er misvisende. Leksikografene bruker verktøy for språkanalyse som er tilgjengelig gjennom språkinfrastrukturen CLARINO (https://clarin.w.uib.no/). Corpuscle er et verktøy for å søke på ord og fraser. Gjennom revisjonsprosjektet er Corpuscle utvidet til å søke i flere korpus samtidig (til sammen ca. 2,4 milliarder ord). For eksempel kan vi gjøre komplekse søk i Nynorskkorpuset, Leksikografisk Bokmålskorpus og Nasjonalbibliotekets frie tekster samtidig. Søketreffene kan sorteres med frekvens over tid og distribusjon i ulike korpus, hvilket forenkler leksikografens empiriske arbeid betydelig. Infrastrukturen INESS lar oss søke etter syntaktiske konstruksjoner som ikke er så lett søkbare i et tradisjonelt tekstkorpus. NorGramBank inneholder syntaktisk analysert materiale for norsk (til sammen ca. 80 mill. ord). Vi vil vise hvordan vi kan hente ut «wordsketch»-lignende informasjon, som de vanligste verbrammene til et verb (gifte seg, gifte bort, gifte seg til) eller typiske eksempler på hvordan at-setninger styres av preposisjoner (etter at, uten at). Relevante lenker: Revisjonsprosjektet for Bokmålsordboka og Nynorskordboka: https://ordbok.uib.no Corpuscle (søk på ordnivå): https://clarino.uib.no/corpuscle INESS (søk på setningsnivå): https://clarino.uib.no/iness