Hopp til hovedinnhold
Nasjonalbiblioteket

Norsk aviskorpus

Beskrivelse

Norsk aviskorpus var et prosjekt ved Universitetet i Bergen der man trålet nyhetsnettsteder etter nyhetsartikler.

Denne versjonen av Norsk aviskorpus består av tekst fra perioden 1998 til og med 2019. Korpuset inneholder om lag 1,68 milliarder ord for bokmål og 68 millioner ord for nynorsk.

Det finnes også en forenklet versjon av korpuset for tekstene fra perioden 1998-2011. Her er alle setningsdubletter fjernet, og setningene er sortert alfabetisk. Setningene er separert med s-tagger.

Tekstene fra 1998-2011 er samlet i en felles nedlastbar fil, ellers foreligger dataene som en fil per år. Se dokumentasjonsfilene for en beskrivelse av innholdet og filformater.

Distribusjoner
1

Last ned
Beskrivelse:
Ikke oppgitt
TilgangsURL:
https://hdl.handle.net/21.11146/4
Direkte nedlastning:
  1. https://www.nb.no/sbfil/tekst/nak_2012.tar
    Genererer forhåndsvisning...
  2. https://www.nb.no/sbfil/tekst/nak_2019.tar
    Genererer forhåndsvisning...
  3. https://www.nb.no/sbfil/tekst/nak_2017.tar
    Genererer forhåndsvisning...
  4. https://www.nb.no/sbfil/dok/nak_1998_2011.pdf
    Genererer forhåndsvisning...
  5. https://www.nb.no/sbfil/tekst/nak_2016.tar
    Genererer forhåndsvisning...
  6. https://www.nb.no/sbfil/tekst/nak_2018.tar
    Genererer forhåndsvisning...
  7. https://www.nb.no/sbfil/dok/nak_2012_2019.pdf
    Genererer forhåndsvisning...
  8. https://www.nb.no/sbfil/tekst/norsk_aviskorpus.zip
    Genererer forhåndsvisning...
  9. https://www.nb.no/sbfil/tekst/nak_2014.tar
    Genererer forhåndsvisning...
  10. https://www.nb.no/sbfil/tekst/nak_2015.tar
    Genererer forhåndsvisning...
  11. https://www.nb.no/sbfil/tekst/nak_2013.tar
    Genererer forhåndsvisning...
API:
Ikke oppgitt
Dokumentasjon:
Ikke oppgitt
Lisens:
I samsvar med:
Ikke oppgitt

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikon 2Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang