Hopp til hovudinnhald
Nasjonalbiblioteket

Fritt tilgjengelege tekster frå NBdigital

  • Datasett
  • Allmenn tilgang 

    Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.

    Les meir om tilgangsnivå her

  • Opne data 

    Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

Skildring

Denne tekstsamlinga er sett saman av tekster som ikkje er underlagt opphavsrettslege restriksjonar (lenger). Materialet består av 26.344 OCR-handsama tekster fordelte på 10.756 ulike forfattarar og andre tekstprodusentar (t.d. offentlege institusjonar).

Materialet kan lastast ned som komprimerte tar.gz-filer som inneheld tekstene i to format: html- og tekstfiler utan nokon form for koding. Teiknkodinga er UTF-8 for begge formata.

Tekstene er henta rett ut frå Nettbiblioteket. Kvaliteten på tekstene er varierande, avhengig av kor god OCR-lesinga er. I tillegg til tekster på norsk (bokmål og nynorsk), inneheld samlinga tekster på fleire andre språk.

Distribusjonar
1

Namnlaus distribusjon
  • gtar
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/34
Status:
Ikkje oppgitt
Direkte nedlasting:
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt
Rettigheter for bruk:
Ikkje oppgitt
Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

ONOMASTICA uttaleleksikonNasjonalbiblioteket
Allmenn tilgang
SNOMED CT - engelske termer med oversettelse til bokmål og nynorskNasjonalbiblioteket
Allmenn tilgang
N-gram frå NBdigitalNasjonalbiblioteket
Allmenn tilgang
Tekster fra norsk WikipediaNasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Amesto Translations ASNasjonalbiblioteket
Allmenn tilgang