Hopp til hovudinnhald
Nasjonalbiblioteket

N-gram - bokmål

Skildring

Disse n-grammene (n=1-6) er laget med utgangspunkt i tekstene i Norsk aviskorpus (24 nettaviser) og nyhetsdelen av tekstkorpuset etter Nordisk språkteknologi AS (NST). Det samlede tekstgrunnlaget for hele materialet er 1175 millioner ord med løpende tekst.

N-grammene er sortert henholdsvis alfabetisk og etter frekvens. Frekvenslister (unigram) er i tillegg publisert separat. En forenklet versjon med en liste over de 1000 mest frekvente n-grammene er også tilgjengelig.

Distribusjonar
1

Last ned
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/12
Direkte nedlasting:
  1. https://www.nb.no/sbfil/tekst/1gram_nob_f1_freq.zip
    Genererer førehandsvising...
  2. https://www.nb.no/sbfil/tekst/ngram_nob_1000.zip
    Genererer førehandsvising...
  3. https://www.nb.no/sbfil/dok/ngram_nob.pdf
    Genererer førehandsvising...
  4. https://www.nb.no/sbfil/tekst/1gram_nob_f1_abc.zip
    Genererer førehandsvising...
  5. https://www.nb.no/sbfil/tekst/1gram_nob_abc.zip
    Genererer førehandsvising...
  6. https://www.nb.no/sbfil/tekst/ngram_nob.tar.gz
    Genererer førehandsvising...
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
spaCy for nynorskNasjonalbiblioteket
Allmenn tilgang