Hopp til hovudinnhald
Nasjonalbiblioteket

Norske idiom

  • Datasett
  • Allmenn tilgang 

    Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.

    Les meir om tilgangsnivå her

  • Opne data 

    Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

Skildring

Dette datasettet består av 3537 norske idiom og fraser som finst fleire enn 100 gonger i Nettbiblioteket. Det er 3455 idiom på bokmål og 88 på nynorsk. I framtida vil vi prøve å leggje til fleire idiom for nynorsk. Sjå dokumentasjonsfila for ei beskriving av datasettet. Dataa kan nyttast til å måle ein generativ språkmodell si evne til å fullføre kjende idiom eller som ei 'masked language modelling'-oppgåve.

Distribusjonar
1

Namnlaus distribusjon
  • zip
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/96
Direkte nedlasting:
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt
Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikonNasjonalbiblioteket
Allmenn tilgang
N-grammer fra NBdigital 2021Nasjonalbiblioteket
Allmenn tilgang