Hopp til hovudinnhald
Nasjonalbiblioteket

Omsetjingsminne frå Semantix AS

  • Datasett
  • Allmenn tilgang 

    Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.

    Les meir om tilgangsnivå her

  • Opne data 

    Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

Skildring

Dette korpuset inneheld ei rekkje omsetjingsminne Nasjonalbiblioteket har overteke frå Semantix AS. Omsetjingane er utførte på vegner av offentlege kontor og institusjonar.

Korpuset er samansett av tekster med engelsk eller norsk (bokmål) originaltekst, og omsetjingar til høvesvis norsk (bokmål) eller engelsk. Det finst nokre veldig få omsetjingar til nynorsk i materialet, men desse har vorte klassifiserte som bokmål.

Det finst ei fil med omsetjingar frå engelsk til bokmål, og ei fil med omsetjingar frå bokmål til engelsk. Filene er i TMX 1.4-format (ein variant av XML). I filene er kvar omsetjingseining (TU - Translation Unit) merkt med institusjonen omsetjinga er gjort for. Ei omsetjingseining svarar i dei fleste høve til ei meiningsberande eining, typisk ei setning, ei overskrift eller liknande. Det kan òg dreie seg om enkeltord eller lengre sekvensar.

Totalt inneheld korpuset 1.325.013 omsetjingseiningar, fordelte slik:

  • engelsk > bokmål: 250.053 TU
  • bokmål > engelsk: 1.074.960 TU

Dokumentasjonsfila inneheld ei oversikt over kva institusjoner som er omfatta og talet på TUer for den enkelte institusjonen.

Distribusjonar
1

Namnlaus distribusjon
  • gtar
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/62
Direkte nedlasting:
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt
Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikonNasjonalbiblioteket
Allmenn tilgang
N-grammer fra NBdigital 2021Nasjonalbiblioteket
Allmenn tilgang