Hopp til hovudinnhald
Nasjonalbiblioteket

Omsetjingsminne frå Nynorsk pressekontor 2022

  • Namnlaus distribusjon
    • application/x-tmx+xml , text/tab-separated-values , application/pdf , text/markdown
    Last ned
  • Datasett
  • Allmenn tilgang 

    Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.

    Les meir om tilgangsnivå her

  • Opne data 

    Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

Skildring

Dette korpuset inneheld omsetjingar frå bokmål til nynorsk av nyhendetekst frå Norsk telegrambyrå (NTB). Tekstene er omsette av Nynorsk pressekontor (NPK), som nyttar Nynorskroboten til automatisk omsetjing av tekster frå bokmål til nynorsk, og korrigerer feila roboten gjer manuelt før publisering. Les meir om dette hjå Nynorsk pressekontor (https://www.npk.no/nynorskroboten).

Materialet skriv seg frå perioden februar 2011 til desember 2022. Av opphavsrettslege grunnar er omsetjingseiningane randomiserte. Ei omsetjingseining svarar stort sett til eit setningspar.

Materialet ligg føre i to ulike filformat, tmx og tsv. Totalt inneheld korpuset 1.069.440 omsetjingspar/setningspar. Sjå dokumentasjonsfila for meir informasjon.

Distribusjonar
1

Namnlaus distribusjon
  • application/x-tmx+xml , text/tab-separated-values , application/pdf , text/markdown
Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Tekster fra norsk WikipediaNasjonalbiblioteket
Allmenn tilgang