Hopp til hovedinnhold
Nasjonalbiblioteket

SCARRIE Leksikon

  • Datasett
  • Allmenn tilgang 

    Offentlig tilgjengelig for alle. Tilgang kan likevel kreve registrering og forespørsel om API-nøkler, så lenge hvem som helst kan be om slik registrering og/eller API-nøkler.

    Les mer om tilgangsnivåer her

  • Åpne data 

    Datasettet er klassifisert som allmenn tilgang og har minst 1 distribusjon med godkjent åpen lisens.

Beskrivelse

Denne fullformsordlisten ble laget som et ledd i utviklingen av et automatisk korrekturprogram for norsk bokmål.

Ordformene i SCARRIE-leksikonet er tagget med informasjon om grunnform (lemma), standardisering, stilnivå, morfosyntaktiske trekk og alternative former. Hovedleksikonet inneholder ord fra de åpne ordklassene (adjektiv, adverb, substantiv og verb). I alt inneholder leksikonet omtrent 361.000 fullformer (72.500 grunnformer).

Kortfattet informasjon om leksikonet finnes i beskrivelsen, på norsk og engelsk. Rapporten "SCARRIE Deliverable 3.3.1" gir en mer utførlig beskrivelse av bl.a. taggsettet som er brukt i leksikonet. Denne rapporten finnes kun på engelsk.

Distribusjoner
1

Navnløs distribusjon
  • zip
Beskrivelse:
Ikke oppgitt
TilgangsURL:
https://hdl.handle.net/21.11146/9
Direkte nedlastning:
API:
Ikke oppgitt
Dokumentasjon:
Ikke oppgitt
Lisens:
I samsvar med:
Ikke oppgitt
Last ned

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikonNasjonalbiblioteket
Allmenn tilgang
N-grammer fra NBdigital 2021Nasjonalbiblioteket
Allmenn tilgang
Diskusjonstekster frå WikipediaNasjonalbiblioteket
Allmenn tilgang