Hopp til hovudinnhald
Nasjonalbiblioteket

Tuva Taledatabase

Skildring

Tuva Taledatabase er utarbeidd av Max Manus AS for test og evaluering av dikteringsløysinga «Tuva».

Databasen inneheld omlag 24 timar innlesen tale frå 40 talarar. 36 av desse snakkar ei bokmålsnær dialekt, fire ei nynorsknær dialekt. Omlag 70% av materialet er manuskriptlesen tale og 30% er spontan tale. Manuskripta i den manuskriptlesne delen av korpuset er som regel korte avisartiklar. Av desse manuskripta vert 25% lesne av alle talarane, medan dei resterande 75% er unike for kvar talar.

All punktuering (punktum, komma, avsnitt osb.) vert lesen opp av innlesarane, og alle lydopptaka er ortografisk transkriberte i to ulike format.

For nynorsk finst det berre manuskriptlesen tale i korpuset.

Innlesarane i Tuva Taledatabase har vorte utvalde for å representere eit tverrsnitt av den norske arbeidsbefolkninga, balansert for alder, kjønn og dialekt.

Alle lydopptaka er utførde med 48 kHz punktprøvingsfrekvens og 32 bit oppløysing med ein mikrofon i ein kanal (mono). Opptaka vart gjennomførte i eit opptaksstudio i Oslo.

Distribusjonar
1

Last ned
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/44
Direkte nedlasting:
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
spaCy for nynorskNasjonalbiblioteket
Allmenn tilgang
Diskusjonstekster frå WikipediaNasjonalbiblioteket
Allmenn tilgang