Hopp til hovedinnhold
Nasjonalbiblioteket

NST svensk ATG-database (16 kHz) - reorganisert

DatasettAllmenn tilgang Åpne data 

Beskrivelse

Denne databasen er laget av Nordisk språkteknologi som datagrunnlag for talegjenkjenning og diktering på svensk. I denne versjonen er dataene strukturert på nytt, slik at databasen enklere kommer til anvendelse.

I den opprinnelige versjonen av materialet var filene organisert i en bestemt mappestruktur der mappenavnene var meningsbærende. Filnavnene var imidlertid ikke meningsbærende, og det fantes også tilfeller av filer med samme navn i forskjellige mapper. Dette viste seg å være upraktisk, siden brukere måtte beholde den opprinnelige mappestrukturen for å kunne benytte seg av dataene.

Filene er derfor navngitt på nytt, slik at filnavnene er unike og meningsbærende uavhengig av mappestrukturen. De opprinnelige metadatafilene var i spl-format; disse er konvertert til JSON-format. Metadatafilene er anonymisert, og tekstkodingen er endret fra ANSI til UTF-8. Metadata og transkripsjoner foreligger også som CSV-filer.

Se dokumentasjonsfilen for en full beskrivelse av dataene og endringene som er gjort.

Distribusjoner
1

Last ned
Beskrivelse:
Ikke oppgitt
TilgangsURL:
https://hdl.handle.net/21.11146/56
Direkte nedlastning:
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/se_2020/metadata_se_csv.zip
API:
Ikke oppgitt
Dokumentasjon:
Ikke oppgitt
Lisens:
I samsvar med:
Ikke oppgitt

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Tekster fra norsk WikipediaNasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikon 2Nasjonalbiblioteket
Allmenn tilgang