Stortinget Speech Corpus versjon 1.0

Datasett
Allmenn tilgang
Offentlig tilgjengelig for alle. Tilgang kan likevel kreve registrering og forespørsel om API-nøkler, så lenge hvem som helst kan be om slik registrering og/eller API-nøkler.
Les mer om tilgangsnivåer her
Åpne data
Datasettet er klassifisert som allmenn tilgang og har minst 1 distribusjon med godkjent åpen lisens.

Oversikt

Distribusjoner og API-er

Detaljer

Diskusjoner

RDF

Beskrivelse

Stortinget Speech Corpus (SSC) er eit taledatasett på meir enn 5000 timar for svakt overvaka taleattkjenning laga av lydopptak og tekst frå Stortingsforhandlingane. Det inneheld taleeiningar på inntil 30 sekund med transkripsjonar på bokmål og nynorsk frå dei offisielle Stortingsforhandlingane.

Datasettet vert distribuert som ei JSONL-fil. Lydfiler, tekstfiler og transkripsjonsfiler (med output frå taleattkjenninga) er inkluderte i datasettet, linka med relative filstiar i JSONL-fila. Merk at berre segmenterte lydfiler er del av korpuset.

Statistikk

Antall segment: 724 783
Total varigheit i timar: 5 190
Antal unike talarar: 729

For meir detaljert informasjon, sjå dokumentasjonsfilene.

Distribusjoner
1

Navnløs distribusjon

gtar

Beskrivelse:

Ikke oppgitt

TilgangsURL:

https://hdl.handle.net/21.11146/91

Status:

Ikke oppgitt

Direkte nedlastning:

API:

Ikke oppgitt

Dokumentasjon:

Ikke oppgitt

Lisens:

https://creativecommons.org/publicdomain/zero/1.0/

I samsvar med:

Ikke oppgitt

Rettigheter for bruk:

Ikke oppgitt

Last ned

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

Omsetjingsminne frå Semantix AS	Nasjonalbiblioteket	Allmenn tilgang
Grafem-til-fonem-modeller for norsk bokmål	Nasjonalbiblioteket	Allmenn tilgang
NB N-gram	Nasjonalbiblioteket	Allmenn tilgang
NST uttaleleksikon for svensk	Nasjonalbiblioteket	Allmenn tilgang
Grafem-til-fonem-modeller for norsk	Nasjonalbiblioteket	Allmenn tilgang

Distribusjoner
1

Navnløs distribusjon

gtar

Beskrivelse:

Ikke oppgitt

TilgangsURL:

https://hdl.handle.net/21.11146/91

Status:

Ikke oppgitt

Direkte nedlastning:

API:

Ikke oppgitt

Dokumentasjon:

Ikke oppgitt

Lisens:

https://creativecommons.org/publicdomain/zero/1.0/

I samsvar med:

Ikke oppgitt

Rettigheter for bruk:

Ikke oppgitt

Last ned

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Kontaktinformasjon

Kontaktpunkt:: Ikke oppgitt
Nettside:: https://www.nb.no/sprakbanken/
E-post:: sprakbanken@nb.no
Telefon:: Ikke oppgitt

Om dataene

Språk:
Innholdsleverandører:: Ikke oppgitt
Opphav:: Ikke oppgitt
Oppdateringsfrekvens:: Ikke oppgitt
Først utgitt: Denne datoen sier når dataene i dette datasettet første gang ble utgitt. Det kan ha skjedd før datasettet ble publisert på data.norge.no.: 1. august 2019
Sist oppdatert:: 15. november 2023
Nøyaktighet:: Ikke oppgitt
Tilgjengelighet:: Ikke oppgitt
Kompletthet:: Ikke oppgitt
Aktualitet:: Ikke oppgitt
Relevans:: Ikke oppgitt
Geografisk avgrensning:: Ikke oppgitt
Tidsmessig avgrensning:: Ikke oppgitt
I samsvar med: Referanse til en implementasjonsregel eller annen spesifikasjon, som ligger til grunn for opprettelsen av datasettet.: Ikke oppgitt

Lovhjemler

Ikke oppgitt

Begreper brukt i datasett

Ikke oppgitt

Referanser

Ikke oppgitt

Gebyr

Ikke oppgitt

Om datasettet

Utgiver:: Nasjonalbiblioteket
Publisert: Denne datoen sier når datasettet ble høstet av data.norge.no. Det kan ha vært tilgjengelig tidligere andre steder. Les mer om høsting her: 21. juni 2024
Sist oppdatert:: 13. mars 2026
Landingsside:: Ikke oppgitt
Dokumentasjon:: Ikke oppgitt
Datasettype:: Ikke oppgitt
Metadatakvalitet: Metadatakvalitet er en indikator på hvor godt datasettene er beskrevet ved hjelp avmetadata. Les mer om metadatakvalitet her: God (59%)
URI:

Tema

Vitenskap og teknologi

Nøkkelord

Diskusjoner på Datalandsbyen
0

Ingen diskusjoner funnet

Hva er Datalandsbyen?

Datalandsbyen er vårt nettforum hvor du kan etterspørre data, dele erfaringer og spørre om råd som gjelder datadeling og informasjonsforvaltning.

Stortinget Speech Corpus versjon 1.0

Beskrivelse

Distribusjoner
1

API-er som tilgjengeliggjør dette datasettet
0

Lignende datasett

Distribusjoner
1

API-er som tilgjengeliggjør dette datasettet
0

Kontaktinformasjon

Om dataene

Lovhjemler

Begreper brukt i datasett

Referanser

Gebyr

Om datasettet

Tema

Nøkkelord

Diskusjoner på Datalandsbyen
0

Hva er Datalandsbyen?

Resource Description Framework (RDF)
Alle URL-er til ressurser på data.norge.no kan levere RDF-metadata i flere ulike formater, avhengig av hvilken Accept header man sender med.
Les mer om RDF og hvilke formater vi støtter her

Finner du det du leter etter?

Stortinget Speech Corpus versjon 1.0

Beskrivelse

Distribusjoner1

API-er som tilgjengeliggjør dette datasettet0

Lignende datasett

Distribusjoner1

API-er som tilgjengeliggjør dette datasettet0

Kontaktinformasjon

Om dataene

Lovhjemler

Begreper brukt i datasett

Referanser

Gebyr

Om datasettet

Tema

Nøkkelord

Diskusjoner på Datalandsbyen0

Hva er Datalandsbyen?

Resource Description Framework (RDF)Alle URL-er til ressurser på data.norge.no kan levere RDF-metadata i flere ulike formater, avhengig av hvilken Accept header man sender med.Les mer om RDF og hvilke formater vi støtter her

Finner du det du leter etter?

Distribusjoner
1

API-er som tilgjengeliggjør dette datasettet
0

Distribusjoner
1

API-er som tilgjengeliggjør dette datasettet
0

Diskusjoner på Datalandsbyen
0

Resource Description Framework (RDF)
Alle URL-er til ressurser på data.norge.no kan levere RDF-metadata i flere ulike formater, avhengig av hvilken Accept header man sender med.
Les mer om RDF og hvilke formater vi støtter her