Norsk talestyringskorpus

Skildring

Norsk talestyringskorpus (engelsk forkorting NVCC) er eit tekst- og talekorpus som består av skrivne og innlesne setningar (spørjingar). Dette er spørjingar ein typisk nyttar til å styre t.d. mobiltelefonar med stemma, og dei er tilpassa typiske funksjonar i mobiltelefonar.

NVCC inneheld 10.706 skrivne spørjingar på både bokmål og nynorsk. Spjørjingane er delte inn i 183 forskjellige intent, fordelte på 24 intentgrupper innanfor ni overordna domene. 9.834 av spørjingane er lesne inn av 11 talarar frå fem forskjellige dialektområde for å femne dialektvariasjon. Opptaka er transkriberte med ei blanding av nynorsk og bokmål for å liggje så nære talaranes dialekt som mogleg. Transkripsjonane og metadata om talarane (dialekt, alder, kjønn) er med i korpuset. Sjå dokumentasjonsfila for meir detaljert informasjon.

NVCC er eit open source-datasett for utvikling av talestyrte mobilassistentar, men kan også vere nyttig for utvikling av tekstbasert språkteknologi som t.d. chatbotar.

NVCC er utvikla av Språkbanken ved Nasjonalbiblioteket. Me set stor pris på attendemeldingar og forslag til forbetringar. Kontakt oss på sprakbanken@nb.no.

Distribusjonar
1

Last ned

Skildring:

Ikkje oppgitt

Tilgjengeleg URL:

https://hdl.handle.net/21.11146/75

Direkte nedlasting:

https://www.nb.no/sbfil/nvcc/nvcc_1.0.tar
Genererer førehandsvising...
https://www.nb.no/sbfil/nvcc/NVCC_about_the_corpus.pdf
Genererer førehandsvising...

API:

Ikkje oppgitt

Dokumentasjon:

Ikkje oppgitt

Lisens:

https://creativecommons.org/publicdomain/zero/1.0/

I samsvar med:

Ikkje oppgitt

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

Norsk ordbank - nynorsk 2005-2012	Nasjonalbiblioteket	Allmenn tilgang
ONOMASTICA uttaleleksikon 2	Nasjonalbiblioteket	Allmenn tilgang
Omsetjingsminne frå Semantix AS	Nasjonalbiblioteket	Allmenn tilgang
Grafem-til-fonem-modeller for norsk	Nasjonalbiblioteket	Allmenn tilgang
SCARRIE Leksikon	Nasjonalbiblioteket	Allmenn tilgang

Fann du det du leitte etter?

Ta kontakt med oss her, eller spør om hjelp i Datalandsbyen.

Norsk talestyringskorpus

Skildring

Distribusjonar1

Namnlaus distribusjonapplication/tar , application/pdf

API-ar som tilbyr dette datasettet0

Liknande datasett

Fann du det du leitte etter?

Distribusjonar
1

API-ar som tilbyr dette datasettet
0