Hopp til hovudinnhald
Nasjonalbiblioteket

NST N-gram - bokmål

  • Datasett
  • Allmenn tilgang 

    Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.

    Les meir om tilgangsnivå her

  • Opne data 

    Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

Skildring

N-grammene er laget med utgangspunkt i deler av tekstkorpuset etter Nordisk språkteknologi AS (NST). Datagrunnlaget for materialet er 510 millioner ord løpende tekst.

Materialet er også tilgjengelig som en oversikt over de 1000 mest frekvente n-grammene (n=1-6).

I den komplette versjonen er alle-n-grammene sortert henholdsvis alfabetisk og etter frekvens. Det er også laget frekvenslister over enkeltordene i materialet (unigram).

Distribusjonar
1

Namnlaus distribusjon
  • gtar
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/3
Direkte nedlasting:
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt
Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikonNasjonalbiblioteket
Allmenn tilgang
N-grammer fra NBdigital 2021Nasjonalbiblioteket
Allmenn tilgang