Hopp til hovedinnhold
Nasjonalbiblioteket

Omsetjingsminne frå Nynorsk pressekontor 2021

DatasettAllmenn tilgang Åpne data 

Beskrivelse

Dette korpuset inneheld omsetjingar frå bokmål til nynorsk av nyhendetekst frå Norsk telegrambyrå (NTB). Tekstene er omsette av Nynorsk pressekontor (NPK), som nyttar den såkalla Nynorskroboten til automatisk omsetjing av tekster frå bokmål til nynorsk, og korrigerer feila roboten gjer manuelt før publisering. Les meir om dette hjå Nynorsk pressekontor (https://www.npk.no/nynorskroboten).

Materialet skriv seg frå perioden februar 2011 til september 2021. Av opphavsrettslege grunnar er omsetjingseiningane randomiserte. Ei omsetjingseining svarar stort sett til eit setningspar.

Materialer delt opp i tre delar, og det finst to ulike filformat, tmx og tsv. Totalt inneheld korpuset omlag 700.000 omsetjingspar/setningspar. Sjå dokumentasjonsfila for meir informasjon.

Distribusjoner
1

Last ned
Beskrivelse:
Ikke oppgitt
TilgangsURL:
https://hdl.handle.net/21.11146/47
Direkte nedlastning:
https://www.nb.no/sbfil/dok/2011_2019_tm_npk_ntb_vitecmv.pdf
API:
Ikke oppgitt
Dokumentasjon:
Ikke oppgitt
Lisens:
I samsvar med:
Ikke oppgitt

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
spaCy for nynorskNasjonalbiblioteket
Allmenn tilgang
Tekster fra norsk WikipediaNasjonalbiblioteket
Allmenn tilgang