Hopp til hovedinnhold
Nasjonalbiblioteket

N-gram - nynorsk

  • Datasett
  • Allmenn tilgang 

    Offentlig tilgjengelig for alle. Tilgang kan likevel kreve registrering og forespørsel om API-nøkler, så lenge hvem som helst kan be om slik registrering og/eller API-nøkler.

    Les mer om tilgangsnivåer her

  • Åpne data 

    Datasettet er klassifisert som allmenn tilgang og har minst 1 distribusjon med godkjent åpen lisens.

Beskrivelse

Med utgangspunkt i dei nynorske tekstene i Norsk aviskorpus og tekstkorpuset til Nordisk språkteknologi har Språkbanken produsert n-gram (n=1-6) for ei tekstmengd på ca. 60 millionar ord med løpande tekst.

Denne versjonen inneheld alle n-gramma, sorterte alfabetisk og etter frekvens.

Materialet kan òg lastast ned som ein enkel oversikt over dei 1000 mest frekvente n-gramma, og i tillegg som frekvenslister over enkeltorda (unigram).

Distribusjoner
1

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Tekster fra norsk WikipediaNasjonalbiblioteket
Allmenn tilgang