Hopp til hovudinnhald
Nasjonalbiblioteket

Fritt tilgjengelege tekster frå NBdigital

  • Datasett
  • Allmenn tilgang 

    Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.

    Les meir om tilgangsnivå her

  • Opne data 

    Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

Skildring

Denne tekstsamlinga er sett saman av tekster som ikkje er underlagt opphavsrettslege restriksjonar (lenger). Materialet består av 26.344 OCR-handsama tekster fordelte på 10.756 ulike forfattarar og andre tekstprodusentar (t.d. offentlege institusjonar).

Materialet kan lastast ned som komprimerte tar.gz-filer som inneheld tekstene i to format: html- og tekstfiler utan nokon form for koding. Teiknkodinga er UTF-8 for begge formata.

Tekstene er henta rett ut frå Nettbiblioteket. Kvaliteten på tekstene er varierande, avhengig av kor god OCR-lesinga er. I tillegg til tekster på norsk (bokmål og nynorsk), inneheld samlinga tekster på fleire andre språk.

Distribusjonar
1

Namnlaus distribusjon
  • gtar
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/34
Direkte nedlasting:
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt
Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikonNasjonalbiblioteket
Allmenn tilgang
N-grammer fra NBdigital 2021Nasjonalbiblioteket
Allmenn tilgang