Hopp til hovedinnhold
Nasjonalbiblioteket

Norsk ordbank - nynorsk 2012

Beskrivelse

Norsk ordbank – nynorsk er ein leksikalsk database som speglar rettskrivingsreforma som vart effektuert 1. august 2012 og seinare justeringar av rettskrivinga for nynorsk.

Databasen er sett saman av ei grunnordliste og eit sett av bøyingsmønster. Kvart ord i grunnordlista har eitt eller fleire bøyingsmønster. Kvart bøyingsmønster inneheld ei line for kvar enkelt bøygde form av grunnordet. Ei line inneheld eit omformingsmønster og informasjon om ordklasse og morfologiske drag. Mønsteret syner korleis grunnordet kan ekspanderast til ei bøygd form.

Dataa er lagra i sju tabellar. Tabellen «lemma» inneheld alle oppslagsorda i Nynorskordboka med spesifikasjon av artikkelnummeret. Fullformslista inneheld alle moglege bøygde former av oppslagsorda i tråd med gjeldande rettskriving. Denne tabellen inneheld òg former som er tenkjelege, men i praksis sjeldan eller aldri brukte, t.d. fleirtalsformer som "snøar" og gradbøygde former som "vyrkeslausast".

Tabellane «lemma_paradigme», «paradigme», «paradigme_boying», «boyingsgruppe» og «boying» inneheld den informasjonen som er naudsynt for å generere fullformene basert på grunnordlista («lemma»). Dei inneheld med andre ord koplinga mellom grunnord og bøyingsmønster, reglar og informasjon om kategoriar.

Tabellen «leddanalyse» inneheld informasjon om leddeling av samansetningar. I Nynorskordboka er leddelinga markert med ein vertikal strek: bank|boks.

Fullformslista inneheld informasjon om argumentstruktur for ein del verb. Dei ulike kodane som er nytta, er beskrivne i fila «norsk_ordbank_argstr.txt».

Legg merkje til at dette er ein dump av databasen slik han låg føre 1. februar 2022. Denne versjonen inneheld 117.445 lemma.

Distribusjoner
1

Last ned
Beskrivelse:
Ikke oppgitt
TilgangsURL:
https://hdl.handle.net/21.11146/41
Direkte nedlastning:
API:
Ikke oppgitt
Dokumentasjon:
Ikke oppgitt
Lisens:
I samsvar med:
Ikke oppgitt

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
spaCy for nynorskNasjonalbiblioteket
Allmenn tilgang