Hopp til hovedinnhold
Nasjonalbiblioteket

Norske idiom

DatasettAllmenn tilgang Åpne data 

Beskrivelse

Dette datasettet består av 3537 norske idiom og fraser som finst fleire enn 100 gonger i Nettbiblioteket. Det er 3455 idiom på bokmål og 88 på nynorsk. I framtida vil vi prøve å leggje til fleire idiom for nynorsk. Sjå dokumentasjonsfila for ei beskriving av datasettet. Dataa kan nyttast til å måle ein generativ språkmodell si evne til å fullføre kjende idiom eller som ei 'masked language modelling'-oppgåve.

Distribusjoner
1

Last ned
Beskrivelse:
Ikke oppgitt
TilgangsURL:
https://hdl.handle.net/21.11146/96
Direkte nedlastning:
https://www.nb.no/sbfil/norske_idiom/norske_idiom.zip
API:
Ikke oppgitt
Dokumentasjon:
Ikke oppgitt
Lisens:
I samsvar med:
Ikke oppgitt

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikon 2Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
Målfrid 2023 – Fritt tilgjengelege tekster frå norske statlege nettsiderNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang