Hopp til hovudinnhald
Nasjonalbiblioteket

Norsk aviskorpus

Distribusjonar 
1
API-ar 
0
Ingen registrerte API-ar tilbyr dette datasettet.
OversiktDistribusjonar og API-ar 
1
DetaljarDiskusjonar 
0
RDF

Skildring

Norsk aviskorpus var et prosjekt ved Universitetet i Bergen der man trålet nyhetsnettsteder etter nyhetsartikler.

Denne versjonen av Norsk aviskorpus består av tekst fra perioden 1998 til og med 2019. Korpuset inneholder om lag 1,68 milliarder ord for bokmål og 68 millioner ord for nynorsk.

Det finnes også en forenklet versjon av korpuset for tekstene fra perioden 1998-2011. Her er alle setningsdubletter fjernet, og setningene er sortert alfabetisk. Setningene er separert med s-tagger.

Tekstene fra 1998-2011 er samlet i en felles nedlastbar fil, ellers foreligger dataene som en fil per år. Se dokumentasjonsfilene for en beskrivelse av innholdet og filformater.


Liknande datasett

SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Tekster fra norsk WikipediaNasjonalbiblioteket
Allmenn tilgang

Kontaktinformasjon

Kontaktpunkt:
Ikkje oppgitt
Nettside:
https://www.nb.no/sprakbanken/
E-post:
sprakbanken@nb.no
Telefon:
Ikkje oppgitt

Om dataane

Språk:
,
Innhaldsleverandørar:
Ikkje oppgitt
Opphav:
Ikkje oppgitt
Oppdateringsfrekvens:
Ikkje oppgitt
Først utgjeve:

Denne datoen seier når dataa i dette datasettet først blei utgitt. Det kan ha skjedd før datasettet blei publisert på data.norge.no.

1. januar 1998
Sist oppdatert:
20. april 2020
Nøyaktigheit:
Ikkje oppgitt
Tilgjenge:
Ikkje oppgitt
Fullstendigheit:
Ikkje oppgitt
Aktualitet:
Ikkje oppgitt
Relevans:
Ikkje oppgitt
Geografisk område:
Ikkje oppgitt
Tidsrom:
Ikkje oppgitt
I samsvar med:

Referanse til ei implementeringsregel eller anna spesifikasjon som ligg til grunn for datasettet.

Ikkje oppgitt

Lovheimler

Ikkje oppgitt

Omgrep brukte i datasettet

Ikkje oppgitt

Referansar

Ikkje oppgitt

Om datasettet

Utgjevar:
Nasjonalbiblioteket
Publisert:

Denne datoen viser når datasettet vart henta inn av data.norge.no. Det kan ha vore tilgjengeleg tidlegare andre stader.

Les meir om innhenting her

3. mars 2026
Sist oppdatert:
13. mars 2026
Landingsside:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Datasettype:
Ikkje oppgitt
Metadatakvalitet:

Metadatakvalitet er ein indikator på kor godt datasettene er beskrive ved hjelp av metadata.

Les meir om metadatakvalitet her

God (60%)
URI:

Tema

Nøkkelord

Ikkje oppgitt

Diskusjonar på Datalandsbyen
0

Ingen diskusjonar funne

Kva er Datalandsbyen?

Datalandsbyen er vårt nettforum der du kan be om data, dele erfaringar og spørje om råd som gjeld deling av data og informasjonsforvalting.