Hopp til hovedinnhold
Nasjonalbiblioteket

Fritt tilgjengelege tekster frå NBdigital

Beskrivelse

Denne tekstsamlinga er sett saman av tekster som ikkje er underlagt opphavsrettslege restriksjonar (lenger). Materialet består av 26.344 OCR-handsama tekster fordelte på 10.756 ulike forfattarar og andre tekstprodusentar (t.d. offentlege institusjonar).

Materialet kan lastast ned som komprimerte tar.gz-filer som inneheld tekstene i to format: html- og tekstfiler utan nokon form for koding. Teiknkodinga er UTF-8 for begge formata.

Tekstene er henta rett ut frå Nettbiblioteket. Kvaliteten på tekstene er varierande, avhengig av kor god OCR-lesinga er. I tillegg til tekster på norsk (bokmål og nynorsk), inneheld samlinga tekster på fleire andre språk.

Distribusjoner
1

Last ned
Beskrivelse:
Ikke oppgitt
TilgangsURL:
https://hdl.handle.net/21.11146/34
Direkte nedlastning:
  1. https://www.nb.no/sbfil/dok/20150526_nbdig_lesmeg.txt
    Genererer forhåndsvisning...
API:
Ikke oppgitt
Dokumentasjon:
Ikke oppgitt
Lisens:
I samsvar med:
Ikke oppgitt

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikon 2Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
spaCy for nynorskNasjonalbiblioteket
Allmenn tilgang