Tuva Taledatabase

Datasett
Allmenn tilgang
Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.
Les meir om tilgangsnivå her
Opne data
Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

Oversikt

Distribusjonar og API-ar

Detaljar

Diskusjonar

RDF

Skildring

Tuva Taledatabase er utarbeidd av Max Manus AS for test og evaluering av dikteringsløysinga «Tuva».

Databasen inneheld omlag 24 timar innlesen tale frå 40 talarar. 36 av desse snakkar ei bokmålsnær dialekt, fire ei nynorsknær dialekt. Omlag 70% av materialet er manuskriptlesen tale og 30% er spontan tale. Manuskripta i den manuskriptlesne delen av korpuset er som regel korte avisartiklar. Av desse manuskripta vert 25% lesne av alle talarane, medan dei resterande 75% er unike for kvar talar.

All punktuering (punktum, komma, avsnitt osb.) vert lesen opp av innlesarane, og alle lydopptaka er ortografisk transkriberte i to ulike format.

For nynorsk finst det berre manuskriptlesen tale i korpuset.

Innlesarane i Tuva Taledatabase har vorte utvalde for å representere eit tverrsnitt av den norske arbeidsbefolkninga, balansert for alder, kjønn og dialekt.

Alle lydopptaka er utførde med 48 kHz punktprøvingsfrekvens og 32 bit oppløysing med ein mikrofon i ein kanal (mono). Opptaka vart gjennomførte i eit opptaksstudio i Oslo.

Distribusjonar
1

Namnlaus distribusjon

gtar

Skildring:: Ikkje oppgitt
Tilgjengeleg URL:: https://hdl.handle.net/21.11146/44
Status:: Ikkje oppgitt
Direkte nedlasting:: https://www.nb.no/sbfil/talegjenkjenning/maxmanus/tuva.tar.gz
API:: Ikkje oppgitt
Dokumentasjon:: Ikkje oppgitt
Lisens:: https://creativecommons.org/licenses/by/4.0/
I samsvar med:: Ikkje oppgitt
Rettigheter for bruk:: Ikkje oppgitt

Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

Omsetjingsminne frå Semantix AS	Nasjonalbiblioteket	Allmenn tilgang
Grafem-til-fonem-modeller for norsk bokmål	Nasjonalbiblioteket	Allmenn tilgang
NB N-gram	Nasjonalbiblioteket	Allmenn tilgang
NST uttaleleksikon for svensk	Nasjonalbiblioteket	Allmenn tilgang
Grafem-til-fonem-modeller for norsk	Nasjonalbiblioteket	Allmenn tilgang

Distribusjonar
1

Namnlaus distribusjon

gtar

Skildring:: Ikkje oppgitt
Tilgjengeleg URL:: https://hdl.handle.net/21.11146/44
Status:: Ikkje oppgitt
Direkte nedlasting:: https://www.nb.no/sbfil/talegjenkjenning/maxmanus/tuva.tar.gz
API:: Ikkje oppgitt
Dokumentasjon:: Ikkje oppgitt
Lisens:: https://creativecommons.org/licenses/by/4.0/
I samsvar med:: Ikkje oppgitt
Rettigheter for bruk:: Ikkje oppgitt

Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Kontaktinformasjon

Kontaktpunkt:: Ikkje oppgitt
Nettside:: https://www.nb.no/sprakbanken/
E-post:: sprakbanken@nb.no
Telefon:: Ikkje oppgitt

Om dataane

Språk:
Innhaldsleverandørar:: Ikkje oppgitt
Opphav:: Ikkje oppgitt
Oppdateringsfrekvens:: Ikkje oppgitt
Først utgjeve: Denne datoen seier når dataa i dette datasettet først blei utgitt. Det kan ha skjedd før datasettet blei publisert på data.norge.no.: 1. januar 2016
Sist oppdatert:: 1. juni 2017
Nøyaktigheit:: Ikkje oppgitt
Tilgjenge:: Ikkje oppgitt
Fullstendigheit:: Ikkje oppgitt
Aktualitet:: Ikkje oppgitt
Relevans:: Ikkje oppgitt
Geografisk område:: Ikkje oppgitt
Tidsrom:: Ikkje oppgitt
I samsvar med: Referanse til ei implementeringsregel eller anna spesifikasjon som ligg til grunn for datasettet.: Ikkje oppgitt

Lovheimler

Ikkje oppgitt

Omgrep brukte i datasettet

Ikkje oppgitt

Referansar

Ikkje oppgitt

Gebyr

Ikkje oppgitt

Om datasettet

Utgjevar:: Nasjonalbiblioteket
Publisert: Denne datoen viser når datasettet vart henta inn av data.norge.no. Det kan ha vore tilgjengeleg tidlegare andre stader. Les meir om innhenting her: 24. august 2021
Sist oppdatert:: 13. mars 2026
Landingsside:: Ikkje oppgitt
Dokumentasjon:: Ikkje oppgitt
Datasettype:: Ikkje oppgitt
Metadatakvalitet: Metadatakvalitet er ein indikator på kor godt datasettene er beskrive ved hjelp av metadata. Les meir om metadatakvalitet her: God (59%)
URI:

Tema

Vitskap og teknologi

Nøkkelord

Ikkje oppgitt

Diskusjonar på Datalandsbyen
0

Ingen diskusjonar funne

Kva er Datalandsbyen?

Datalandsbyen er vårt nettforum der du kan be om data, dele erfaringar og spørje om råd som gjeld deling av data og informasjonsforvalting.

Tuva Taledatabase

Skildring

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Liknande datasett

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Kontaktinformasjon

Om dataane

Lovheimler

Omgrep brukte i datasettet

Referansar

Gebyr

Om datasettet

Tema

Nøkkelord

Diskusjonar på Datalandsbyen
0

Kva er Datalandsbyen?

Resource Description Framework (RDF)
Alle URL-ar til ressursar på data.norge.no kan levere RDF-metadata i fleire ulike format, avhengig av kva for ein Accept-header som blir sendt med.
Les meir om RDF og kva format vi støttar her

Fann du det du leitte etter?

Tuva Taledatabase

Skildring

Distribusjonar1

API-ar som tilbyr dette datasettet0

Liknande datasett

Distribusjonar1

API-ar som tilbyr dette datasettet0

Kontaktinformasjon

Om dataane

Lovheimler

Omgrep brukte i datasettet

Referansar

Gebyr

Om datasettet

Tema

Nøkkelord

Diskusjonar på Datalandsbyen0

Kva er Datalandsbyen?

Resource Description Framework (RDF)Alle URL-ar til ressursar på data.norge.no kan levere RDF-metadata i fleire ulike format, avhengig av kva for ein Accept-header som blir sendt med.Les meir om RDF og kva format vi støttar her

Fann du det du leitte etter?

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Diskusjonar på Datalandsbyen
0

Resource Description Framework (RDF)
Alle URL-ar til ressursar på data.norge.no kan levere RDF-metadata i fleire ulike format, avhengig av kva for ein Accept-header som blir sendt med.
Les meir om RDF og kva format vi støttar her