npn-topp

Lars S. Vikør:

Nynorskdelen av Dokumentasjonsprosjektet

Eg skal ta for meg nynorskdelen av Dokumentasjonsprosjektet. Materialet vårt består (som sagt) av to typar:

For det første har vi setelarkivet til Norsk Ordbok, som er lagt inn i form av elektroniske faksimilar, og der ein vil kunne søkje på oppslagsord med grammatisk merking og kjelde. På den måten blir arkivet tilgjengeleg utan omsyn til kor folk er i geografien: Dei som vil gjennomføre ordstudiar innanfor nynorsk og dialektane kan få fram materialet i alle fall reint teknisk utan å komme hit til oss.

For det andre har vi det innskanna tekstkorpuset. Det består av fleire tekstkategoriar: Det er eit representativt utval av nynorsk skjønnlitteratur, inkludert samla verk av dei største namna: Aasen, Vinje, Garborg, Duun - og så har vi Bibelen, utvalde årgangar av Syn og Segn, folkloristisk materiale frå Norsk Folkeminnelags Skrifter, Gamalt or Setesdal, og eldre leksikografisk materiale i form av gamle ordsamlingar. Målet er også å få lagt inn ordboksklassikarane Aasen og Ross, og dei ferdige delane av Norsk Ordbok. Dette korpuset blir svært godt gjennomarbeidd og korrekturlese, så vi meiner det blir noko av det beste vi har i sitt slag.

I tillegg kan vi nemne at det såkalla Grunnmanuskriptet er innskrive og gjort søkbart. Grunnmanuskriptet er det første manuskriptet som kom ut av arbeidet med det som skulle bli Norsk Ordbok i 1930-åra. Det er ei samanarbeiding av dei ordbøkene som da fanst, nemleg Aasen, Ross, Vidsteens sunnhordlandsordbok, Schjøtts ordbøker, Torps etymologiske ordbøker og nokre mindre verk. Det er grundig tagga og koda, slik at ein der kan søkje på grammatiske opplysningar, heimfesting, kjelde, stilistiske og andre typar bruksmerkingar, semantiske kategoriar (t.d. orda kvinne eller kvende), osv. Ei forskingsoppgåve dette materialet gjer mogleg, er såleis grundigare analysar av desse leksikografiske klassikarane.

Når det gjeld setelarkivet, så har ein i prinsippet to inngangar der når ein vil søkje. Den eine er oppslagsord med grammatisk merking. Ein kan få fram alle setlar på eit bestemt ord og deretter merkje dei og sortere dei etter behov. For det andre har vi kjeldefeltet, som kanskje kan gi enda meir interessante moglegheiter. Av kjelder har vi to slag: Det er den heimelsmannen eller -kvinna som har laga og sendt inn setelen, og det er den skriftlege kjelda setelen er teken frå. For det skriftlege materialet er det siste sjølvsagt mest interessant, men for det mest unike vi har, oppskriftene frå dialektane, er det tilvisinga til heimelspersonen som står sentralt, fordi den også inneheld ei heimfesting - kvar person har konsentrert seg om å sende inn opplysningar frå ein bestemt dialekt, sin eigen. Ein kan altså bruke materialet til å lage regionale ordbøker som kan bli meir omfattande og fullstendige enn dei vi har frå før. Ein kan òg kople det saman med skriftlege kjelder, medrekna eldre ordbøker frå dei same dialektane, geografiske referansar hos Aasen og Ross osv. I tillegg kan vi bruke kjeldefeltet til meir spesialiserte undersøkingar som å søkje på yrke, landsdel, kjønn osv. og sjå skilnaden på ordtilfanget dei enkelte har sendt inn.

Når det gjeld det innskanna tekstkorpuset, så kan ein bruke det på så mange måtar at det er mest fantasien som set grenser, men det blir meir parallelt med bokmålskorpuset og andre liknande korpus. Derfor seier eg ikkje meir om det utover det som alt er nemnt, men går over til neste hovudpunkt, som er: Korleis kan dette materialet brukast i forsking?

Da må ein først slå fast at hovudføremålet med heile prosjektet er leksikografisk. Altså for nynorsken sin del: å skaffe ein betre reiskap i redigeringa av Norsk Ordbok. Det kan òg brukast i andre ordboksprosjekt. Til dømes kan vi lage langt betre og meir omfattande dialektordbøker med dette materialet enn vi kunne før. Spesialordbøker av ulike slag vil vi òg kunne få til, for ikkje å snakke om konkordansar over enkeltverk og forfattarskapar. Dette er vel det mest opplagde bruksområdet, trur eg.

Enda fleire bruksområde kan vi finne i dei nærskylde felta metaleksikografi og leksikologi. Innanfor metaleksikografien kan vi drive historiske studiar, som til dømes nærare analysar av ordboksklassikarane Aasen og Ross, ordutvalsstudiar, jamføringar av definisjonspraksis, geografiske studiar osv. Vi kan til dømes komme fram til meir autoritative svar på spørsmålet om Aasen og Ross favoriserte visse landsdelar i ordutvalet og tydingsfastsetjingane sine.

Sjølve samanstillinga av setelarkivet og det skanna tekstkorpuset kan gi interessante leksikografiske forskingsoppgåver. Ein kan talfeste og jamføre to ulike leksikografiske metodar som fram til no har vore konkurrerande. Ein vil også kunne samanlikne det ordtilfanget setelarkivet har med eit tekstkorpus, og såleis t.d. finne ut om eit ekserpert materiale gir eit bilete av det spesielle, mens tekstkorpus viser det generelle i språket.

Leksikologi definerer eg som vitskapen om ord og ordtilfang, til skilnad frå leksikografi, som er ordboksteori og ordbokspraksis. Også leksikologien byr på mange spennande oppgåver som databasane våre kan gjere realiserbare. Eitt eksempel er: Bruken av Aasen og Ross sine ordbøker i nynorsk litteratur. Kva slags ord, gjerne frå eit regionalt avgrensa tilfang, finn vi att i seinare nynorsk fag- og skjønnlitteratur, og kva for nokre fall daude til jorda? Så har vi det evig aktuelle spørsmålet om lånord og "anbeheitelse-ord". Vi kan med dette korpuset undersøkje systematisk kva slags status dei har hatt i praktisk bruk i ulike periodar i ulike sjangrar, hos ulike forfattarar osv. Tilsvarande studiar i det talemålet arkivet dekkjer, vil det òg vere lett å få til. Arbeidet vil ikkje gå ut på å leite fram stoff, men å avgrense det og formulere problemstillingar.

Eg skal ikkje gå så nøye inn på kva andre greiner av språkvitskapen kan bruke dette til, for det bør vel bli eit viktig tema i ordskiftet seinare, sidan fleirtalet av oss her ikkje er leksikografar. Men eg kan jo nemne eit korpusbasert prosjekt innanfor språkhistoria, i denne samanhengen rettskrivingshistoria, nemleg den undersøkinga Norsk språkråd har fått gjort av rettskrivinga hos tre generasjonar prosaforfattarar innanfor bokmål og nynorsk (Pettersen 1993, Vikør 1995). Denne undersøkinga kan med fordel utvidast til andre sjangrar enn skjønnlitteratur, og til meir moderne tekster - vår undersøking gjekk berre fram til 1970-år - for å få eit meir representativt bilete.

Eg nemner eit par andre døme på prosjektidear:

- Avviklinga av fleirtalsbøying av verb i skriftspråket (begge målformer), sett i samanheng med kronologi, sjanger, enkeltforfattarar o.l.

- Nye semantiske (og syntaktiske?) eigenskapar ved preposisjonen

Men dette er berre meint som oppvarming. Eg stoppar her, i von om at dei som arbeider på andre felt kan komme med relevante problemstillingar i det vidare ordskiftet.

Litteratur

Pettersen, Egil 1993: Språknormering og forfatterne. Ortografi og morfembruk hos ti bokmålsforfattere fra hvert av årene 1937, 1957 og 1977. Eigenproduksjon 49. Nordisk institutt, Universitetet i Bergen

Vikør, Lars S. 1995: Rettskriving hos nynorskforfattarar. Norsk språkråds skrifter 3

npn-botn