Hopp til hovudinnhald
Nasjonalbiblioteket

Fritt tilgjengelege tekster frå NBdigital

Skildring

Denne tekstsamlinga er sett saman av tekster som ikkje er underlagt opphavsrettslege restriksjonar (lenger). Materialet består av 26.344 OCR-handsama tekster fordelte på 10.756 ulike forfattarar og andre tekstprodusentar (t.d. offentlege institusjonar).

Materialet kan lastast ned som komprimerte tar.gz-filer som inneheld tekstene i to format: html- og tekstfiler utan nokon form for koding. Teiknkodinga er UTF-8 for begge formata.

Tekstene er henta rett ut frå Nettbiblioteket. Kvaliteten på tekstene er varierande, avhengig av kor god OCR-lesinga er. I tillegg til tekster på norsk (bokmål og nynorsk), inneheld samlinga tekster på fleire andre språk.

Distribusjonar
1

Last ned
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/34
Direkte nedlasting:
  1. https://www.nb.no/sbfil/dok/20150526_nbdig_lesmeg.txt
    Genererer førehandsvising...
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikon 2Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
spaCy for nynorskNasjonalbiblioteket
Allmenn tilgang