Hopp til hovudinnhald
Nasjonalbiblioteket

Sakspapir frå nynorskkommunar

Distribusjonar 
1
API-ar 
0
Ingen registrerte API-ar tilbyr dette datasettet.
  • Datasett
  • Allmenn tilgang 

    Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.

    Les meir om tilgangsnivå her

  • Opne data 

    Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

OversiktDistribusjonar og API-ar 
1
DetaljarDiskusjonar 
0
RDF

Skildring

Tekstene i dette korpuset er samla inn med crawleren Veidemann i samarbeid med Nettarkivet på Nasjonalbiblioteket, basert på ei omarbeidd liste over kommunar frå Landssamanslutninga av nynorskkommunar (lnk.no).

Ein crawler er ein robot som følgjer hyperlenkjer på nettet og lastar ned nye nettsider han finn. For dette korpuset vart Veidemann satt til å laste ned dokument i publiseringsformat som pdf. Lista Veidemann har teke som utgangspunkt, har leidd han til sakspapir på websidene til dei ulike kommunane.

Den resulterande samlinga med dokument er så skanna ved hjelp av Googles optiske teiknattkjennings-api. Sjølv om OCR-lesinga gjennomgåande er god, vil det finnast feillesingar. Det endelege korpuset er sett saman av 50.000 dokument, og inneheld totalt omlag 127 millionar ord. Ca. 88,5 millionar av desse er på nynorsk, resten er stort sett på bokmål. Alle tekstene i korpuset er klassifiserte etter språk.

Korpuset er i denne omgangen publisert som eit json-objekt, der nøkkelen er ein identifikator (URN) for Veidemann-nedlastinga og verdien er ei liste av lister over sidene i dokumentet med tilhøyrande sidetal og målform. Det ligg òg ved ei liste over URN-ane i korpuset. Desse URN-ane syner vidare til nettsida (URL-en) som dokumentet vart lasta ned frå.

Dei originale pdf-filene og ocr-formatet er tilgjengelege på førespurnad til Språkbanken. Kontakt oss på e-post til sprakbanken@nb.no.

Distribusjonar
1

Namnlaus distribusjon
  • gtar
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/60
Status:
Ikkje oppgitt
Direkte nedlasting:
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt
Rettigheter for bruk:
Ikkje oppgitt
Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Tekster fra norsk WikipediaNasjonalbiblioteket
Allmenn tilgang

Distribusjonar
1

Namnlaus distribusjon
  • gtar
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/60
Status:
Ikkje oppgitt
Direkte nedlasting:
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt
Rettigheter for bruk:
Ikkje oppgitt
Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Kontaktinformasjon

Kontaktpunkt:
Ikkje oppgitt
Nettside:
https://www.nb.no/sprakbanken/
E-post:
sprakbanken@nb.no
Telefon:
Ikkje oppgitt

Om dataane

Språk:
,
Innhaldsleverandørar:
Ikkje oppgitt
Opphav:
Ikkje oppgitt
Oppdateringsfrekvens:
Ikkje oppgitt
Først utgjeve:

Denne datoen seier når dataa i dette datasettet først blei utgitt. Det kan ha skjedd før datasettet blei publisert på data.norge.no.

16. oktober 2019
Sist oppdatert:
4. desember 2020
Nøyaktigheit:
Ikkje oppgitt
Tilgjenge:
Ikkje oppgitt
Fullstendigheit:
Ikkje oppgitt
Aktualitet:
Ikkje oppgitt
Relevans:
Ikkje oppgitt
Geografisk område:
Ikkje oppgitt
Tidsrom:
Ikkje oppgitt
I samsvar med:

Referanse til ei implementeringsregel eller anna spesifikasjon som ligg til grunn for datasettet.

Ikkje oppgitt

Lovheimler

Ikkje oppgitt

Omgrep brukte i datasettet

Ikkje oppgitt

Referansar

Ikkje oppgitt

Om datasettet

Utgjevar:
Nasjonalbiblioteket
Publisert:

Denne datoen viser når datasettet vart henta inn av data.norge.no. Det kan ha vore tilgjengeleg tidlegare andre stader.

Les meir om innhenting her

3. mars 2026
Sist oppdatert:
13. mars 2026
Landingsside:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Datasettype:
Ikkje oppgitt
Metadatakvalitet:

Metadatakvalitet er ein indikator på kor godt datasettene er beskrive ved hjelp av metadata.

Les meir om metadatakvalitet her

God (59%)
URI:

Tema

Nøkkelord

Ikkje oppgitt

Diskusjonar på Datalandsbyen
0

Ingen diskusjonar funne

Kva er Datalandsbyen?

Datalandsbyen er vårt nettforum der du kan be om data, dele erfaringar og spørje om råd som gjeld deling av data og informasjonsforvalting.