npn-topp

Oddrun Rangsæter:

Delprosjekt nynorsk ved Dokumentasjonsprosjektet

Delprosjekt nynorsk har vore med i Dokumentasjonsprosjektet frå starten av i 1991 og skal avsluttast desember 1997, saman med resten av fase 1 i Dokumentasjonsprosjektet.

Hovudføremålet til Delprosjekt nynorsk er å konvertere setelarkivet til Norsk Ordbok (om lag 3 millionar ordsetlar) frå papir til elektronisk form. I tillegg har vi skanna inn ein del litteratur og skrive inn og merkt opp Grunnmanuskriptet.

Setelarkivet. Arkivet må seiast å vere både ueinsarta, mangfaldig og i utgangspunktet lite eigna for eit velstrukturert informasjonssystem. Det inneheld både såkalla talemålssetlar, det vil seie setlar med talemålsopplysningar frå ulike delar av landet, og såkalla litteratursetlar. Litteratursetlane er ekserperte frå ulike skriftlege kjelder; det vere seg aviser, tidsskrift, faglitterære eller skjønnlitterære bøker, ordsamlingar o.a.

Sjølve konverteringa av setelarkivet skjer ved at Kodak Norge skannar inn eitt bilete av kvar einskild setel. Desse bileta, eller faksimilane, vert lagra på teip, cd-plater og mikrofilm. I digitalisert form utgjer heile setelarkivet ein liten stabel på om lag 70-80 cd-plater. Det vidare arbeidet med faksimilane vert utført av registreringssentralen i Mo i Rana. Her vert oppslagsord og kjeldeopplysningar på kvar setel registrerte, og desse opplysningane skal så leggjast i ein eigen database saman med faksimilane. Ein kan då søkje seg fram og sortere setlane på grunnlag av oppslag, grammatikk og/eller kjelde samtidig som ein vil få opp bilete av kvar einskild setel.

Skanna materiale. Litterære verk av ymse nynorske forfattarar og eit utval gamle ordsamlingar er skanna inn og delvis merkte (SGML, jf. artikkelen til Anne Engø). Det meste av dette er tekstar som ein finn brokkar av på setlane, og dette materialet vil difor vere eit supplement til seteldatabasen. Vi har skanna Bibelen (1921) og samla verk av Aasen, Garborg og Vinje, men også bøker av Olav Duun, Sjur Bygd, Bergsgård/Eskeland, Halvor Floden, Nikolaus Gjelsvik, Johannes Heggland, Lars Jaastad, Rasmus Løland, Sven Moren, Ola Setrom, Johannes Skar, Per Sivle og Jens Tvedt. Vi har òg skanna artiklar frå Syn og Segn frå 70-, 80- og 90-åra. Til no har vi skanna inn 35 eldre ordsamlingar. Desse skal merkjast opp meir nøyaktig og gjevast normert oppslag.

Grunnmanuskriptet. Delprosjekt nynorsk har ferdigtagga og ferdigstilt grunnmanuskriptet til Norsk Ordbok. Grunnmanuskriptet vart laga i 1930-åra (ca 13 500 maskinskrivne A4-sider med stort sett dobbel lineavstand). Oppslaga er henta frå ordbøkene til Aasen, Ross, Schjøtt, Vidsteen, Torp o.a., men dei har alle fått nynorske definisjonar mens dei tidlegare ordbøkene hadde definisjonane på dansk. Manuskriptet vart aldri utgitt som eiga ordbok, men det danna grunnlaget for arbeidet med Norsk Ordbok. Dette manuskriptet var det første materialet som vart ferdig og tilgjengeleg for bruk i elektronisk form ved Dokumentasjonsprosjektet. Det er skrive inn og merkt slik at det skal vere lett å finne fram til dei ulike opplysningane, t.d. dialektformer med heimfestingar, etymologi, sitat og kjelder.

Eit opplagt mål for det arbeidet som vert utført ved Delprosjekt nynorsk, er å gjere nynorsk-materialet tilgjengeleg for alle som ønskjer å arbeide med det. Dette er eit mål vi deler med mange andre delprosjekt. Eit anna felles mål er å bidra til ei effektivisering av arbeidet med empirisk materiale. For vår del gjeld det særleg i høve til arbeidet med Norsk Ordbok. Ved å bruke seteldatabasen får leksikografane høve til å systematisere setlane automatisk på ulike vis. Ein kan til dømes be om å få alle setlane frå eit gitt geografisk område for å skaffe seg oversikt over ein viss dialekt, eller ein kan søkje etter bruken av ei gitt ordform i eit visst distrikt. Ein kan også be om å få berre munnlege eller berre skriftlege opplysningar (dvs. talemålssetlar eller litteratursetlar), eller ein kan sjølvsagt be om å få strukturert opplysningane ut frå eit gitt oppslagsord. Ein får på denne måten fleire inngangar til arkivet og dermed høve til å få tak i opplysningar som ikkje er tilgjengelege i dag.

Setelbasen vil ha størst bruksverdi for leksikografar, men basen er sjølvsagt ein viktig del av det større informasjonssystemet som Dokumentasjonsprosjektet med alle delprosjekta sine utgjer.

npn-botn