Norsk talestyringskorpus

Datasett
Allmenn tilgang
Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.
Les meir om tilgangsnivå her
Opne data
Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

Oversikt

Distribusjonar og API-ar

Detaljar

Diskusjonar

RDF

Skildring

Norsk talestyringskorpus (engelsk forkorting NVCC) er eit tekst- og talekorpus som består av skrivne og innlesne setningar (spørjingar). Dette er spørjingar ein typisk nyttar til å styre t.d. mobiltelefonar med stemma, og dei er tilpassa typiske funksjonar i mobiltelefonar.

NVCC inneheld 10.706 skrivne spørjingar på både bokmål og nynorsk. Spjørjingane er delte inn i 183 forskjellige intent, fordelte på 24 intentgrupper innanfor ni overordna domene. 9.834 av spørjingane er lesne inn av 11 talarar frå fem forskjellige dialektområde for å femne dialektvariasjon. Opptaka er transkriberte med ei blanding av nynorsk og bokmål for å liggje så nære talaranes dialekt som mogleg. Transkripsjonane og metadata om talarane (dialekt, alder, kjønn) er med i korpuset. Sjå dokumentasjonsfila for meir detaljert informasjon.

NVCC er eit open source-datasett for utvikling av talestyrte mobilassistentar, men kan også vere nyttig for utvikling av tekstbasert språkteknologi som t.d. chatbotar.

NVCC er utvikla av Språkbanken ved Nasjonalbiblioteket. Me set stor pris på attendemeldingar og forslag til forbetringar. Kontakt oss på sprakbanken@nb.no.

Distribusjonar
1

Namnlaus distribusjon

application/tar , application/pdf

Skildring:

Ikkje oppgitt

Tilgjengeleg URL:

https://hdl.handle.net/21.11146/75

Status:

Ikkje oppgitt

Direkte nedlasting:

API:

Ikkje oppgitt

Dokumentasjon:

Ikkje oppgitt

Lisens:

https://creativecommons.org/publicdomain/zero/1.0/

I samsvar med:

Ikkje oppgitt

Rettigheter for bruk:

Ikkje oppgitt

Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

Omsetjingsminne frå Semantix AS	Nasjonalbiblioteket	Allmenn tilgang
Grafem-til-fonem-modeller for norsk bokmål	Nasjonalbiblioteket	Allmenn tilgang
NB N-gram	Nasjonalbiblioteket	Allmenn tilgang
NST uttaleleksikon for svensk	Nasjonalbiblioteket	Allmenn tilgang
Grafem-til-fonem-modeller for norsk	Nasjonalbiblioteket	Allmenn tilgang

Distribusjonar
1

Namnlaus distribusjon

application/tar , application/pdf

Skildring:

Ikkje oppgitt

Tilgjengeleg URL:

https://hdl.handle.net/21.11146/75

Status:

Ikkje oppgitt

Direkte nedlasting:

API:

Ikkje oppgitt

Dokumentasjon:

Ikkje oppgitt

Lisens:

https://creativecommons.org/publicdomain/zero/1.0/

I samsvar med:

Ikkje oppgitt

Rettigheter for bruk:

Ikkje oppgitt

Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Kontaktinformasjon

Kontaktpunkt:: Ikkje oppgitt
Nettside:: https://www.nb.no/sprakbanken/
E-post:: sprakbanken@nb.no
Telefon:: Ikkje oppgitt

Om dataane

Språk:
Innhaldsleverandørar:: Ikkje oppgitt
Opphav:: Ikkje oppgitt
Oppdateringsfrekvens:: Ikkje oppgitt
Først utgjeve: Denne datoen seier når dataa i dette datasettet først blei utgitt. Det kan ha skjedd før datasettet blei publisert på data.norge.no.: 6. januar 2020
Sist oppdatert:: 15. desember 2022
Nøyaktigheit:: Ikkje oppgitt
Tilgjenge:: Ikkje oppgitt
Fullstendigheit:: Ikkje oppgitt
Aktualitet:: Ikkje oppgitt
Relevans:: Ikkje oppgitt
Geografisk område:: Ikkje oppgitt
Tidsrom:: Ikkje oppgitt
I samsvar med: Referanse til ei implementeringsregel eller anna spesifikasjon som ligg til grunn for datasettet.: Ikkje oppgitt

Lovheimler

Ikkje oppgitt

Omgrep brukte i datasettet

Ikkje oppgitt

Referansar

Ikkje oppgitt

Gebyr

Ikkje oppgitt

Om datasettet

Utgjevar:: Nasjonalbiblioteket
Publisert: Denne datoen viser når datasettet vart henta inn av data.norge.no. Det kan ha vore tilgjengeleg tidlegare andre stader. Les meir om innhenting her: 15. desember 2022
Sist oppdatert:: 13. mars 2026
Landingsside:: Ikkje oppgitt
Dokumentasjon:: Ikkje oppgitt
Datasettype:: Ikkje oppgitt
Metadatakvalitet: Metadatakvalitet er ein indikator på kor godt datasettene er beskrive ved hjelp av metadata. Les meir om metadatakvalitet her: God (59%)
URI:

Tema

Vitskap og teknologi

Nøkkelord

Ikkje oppgitt

Diskusjonar på Datalandsbyen
0

Ingen diskusjonar funne

Kva er Datalandsbyen?

Datalandsbyen er vårt nettforum der du kan be om data, dele erfaringar og spørje om råd som gjeld deling av data og informasjonsforvalting.

Norsk talestyringskorpus

Skildring

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Liknande datasett

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Kontaktinformasjon

Om dataane

Lovheimler

Omgrep brukte i datasettet

Referansar

Gebyr

Om datasettet

Tema

Nøkkelord

Diskusjonar på Datalandsbyen
0

Kva er Datalandsbyen?

Resource Description Framework (RDF)
Alle URL-ar til ressursar på data.norge.no kan levere RDF-metadata i fleire ulike format, avhengig av kva for ein Accept-header som blir sendt med.
Les meir om RDF og kva format vi støttar her

Fann du det du leitte etter?

Norsk talestyringskorpus

Skildring

Distribusjonar1

API-ar som tilbyr dette datasettet0

Liknande datasett

Distribusjonar1

API-ar som tilbyr dette datasettet0

Kontaktinformasjon

Om dataane

Lovheimler

Omgrep brukte i datasettet

Referansar

Gebyr

Om datasettet

Tema

Nøkkelord

Diskusjonar på Datalandsbyen0

Kva er Datalandsbyen?

Resource Description Framework (RDF)Alle URL-ar til ressursar på data.norge.no kan levere RDF-metadata i fleire ulike format, avhengig av kva for ein Accept-header som blir sendt med.Les meir om RDF og kva format vi støttar her

Fann du det du leitte etter?

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Diskusjonar på Datalandsbyen
0

Resource Description Framework (RDF)
Alle URL-ar til ressursar på data.norge.no kan levere RDF-metadata i fleire ulike format, avhengig av kva for ein Accept-header som blir sendt med.
Les meir om RDF og kva format vi støttar her