Stortinget Speech Corpus versjon 1.0

Datasett
Allmenn tilgang
Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.
Les meir om tilgangsnivå her
Opne data
Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

Oversikt

Distribusjonar og API-ar

Detaljar

Diskusjonar

RDF

Skildring

Stortinget Speech Corpus (SSC) er eit taledatasett på meir enn 5000 timar for svakt overvaka taleattkjenning laga av lydopptak og tekst frå Stortingsforhandlingane. Det inneheld taleeiningar på inntil 30 sekund med transkripsjonar på bokmål og nynorsk frå dei offisielle Stortingsforhandlingane.

Datasettet vert distribuert som ei JSONL-fil. Lydfiler, tekstfiler og transkripsjonsfiler (med output frå taleattkjenninga) er inkluderte i datasettet, linka med relative filstiar i JSONL-fila. Merk at berre segmenterte lydfiler er del av korpuset.

Statistikk

Antall segment: 724 783
Total varigheit i timar: 5 190
Antal unike talarar: 729

For meir detaljert informasjon, sjå dokumentasjonsfilene.

Distribusjonar
1

Namnlaus distribusjon

gtar

Skildring:

Ikkje oppgitt

Tilgjengeleg URL:

https://hdl.handle.net/21.11146/91

Status:

Ikkje oppgitt

Direkte nedlasting:

API:

Ikkje oppgitt

Dokumentasjon:

Ikkje oppgitt

Lisens:

https://creativecommons.org/publicdomain/zero/1.0/

I samsvar med:

Ikkje oppgitt

Rettigheter for bruk:

Ikkje oppgitt

Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

Omsetjingsminne frå Semantix AS	Nasjonalbiblioteket	Allmenn tilgang
Grafem-til-fonem-modeller for norsk bokmål	Nasjonalbiblioteket	Allmenn tilgang
NB N-gram	Nasjonalbiblioteket	Allmenn tilgang
NST uttaleleksikon for svensk	Nasjonalbiblioteket	Allmenn tilgang
Grafem-til-fonem-modeller for norsk	Nasjonalbiblioteket	Allmenn tilgang

Distribusjonar
1

Namnlaus distribusjon

gtar

Skildring:

Ikkje oppgitt

Tilgjengeleg URL:

https://hdl.handle.net/21.11146/91

Status:

Ikkje oppgitt

Direkte nedlasting:

API:

Ikkje oppgitt

Dokumentasjon:

Ikkje oppgitt

Lisens:

https://creativecommons.org/publicdomain/zero/1.0/

I samsvar med:

Ikkje oppgitt

Rettigheter for bruk:

Ikkje oppgitt

Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Kontaktinformasjon

Kontaktpunkt:: Ikkje oppgitt
Nettside:: https://www.nb.no/sprakbanken/
E-post:: sprakbanken@nb.no
Telefon:: Ikkje oppgitt

Om dataane

Språk:
Innhaldsleverandørar:: Ikkje oppgitt
Opphav:: Ikkje oppgitt
Oppdateringsfrekvens:: Ikkje oppgitt
Først utgjeve: Denne datoen seier når dataa i dette datasettet først blei utgitt. Det kan ha skjedd før datasettet blei publisert på data.norge.no.: 1. august 2019
Sist oppdatert:: 15. november 2023
Nøyaktigheit:: Ikkje oppgitt
Tilgjenge:: Ikkje oppgitt
Fullstendigheit:: Ikkje oppgitt
Aktualitet:: Ikkje oppgitt
Relevans:: Ikkje oppgitt
Geografisk område:: Ikkje oppgitt
Tidsrom:: Ikkje oppgitt
I samsvar med: Referanse til ei implementeringsregel eller anna spesifikasjon som ligg til grunn for datasettet.: Ikkje oppgitt

Lovheimler

Ikkje oppgitt

Omgrep brukte i datasettet

Ikkje oppgitt

Referansar

Ikkje oppgitt

Gebyr

Ikkje oppgitt

Om datasettet

Utgjevar:: Nasjonalbiblioteket
Publisert: Denne datoen viser når datasettet vart henta inn av data.norge.no. Det kan ha vore tilgjengeleg tidlegare andre stader. Les meir om innhenting her: 21. juni 2024
Sist oppdatert:: 13. mars 2026
Landingsside:: Ikkje oppgitt
Dokumentasjon:: Ikkje oppgitt
Datasettype:: Ikkje oppgitt
Metadatakvalitet: Metadatakvalitet er ein indikator på kor godt datasettene er beskrive ved hjelp av metadata. Les meir om metadatakvalitet her: God (59%)
URI:

Tema

Vitskap og teknologi

Nøkkelord

Ikkje oppgitt

Diskusjonar på Datalandsbyen
0

Ingen diskusjonar funne

Kva er Datalandsbyen?

Datalandsbyen er vårt nettforum der du kan be om data, dele erfaringar og spørje om råd som gjeld deling av data og informasjonsforvalting.

Stortinget Speech Corpus versjon 1.0

Skildring

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Liknande datasett

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Kontaktinformasjon

Om dataane

Lovheimler

Omgrep brukte i datasettet

Referansar

Gebyr

Om datasettet

Tema

Nøkkelord

Diskusjonar på Datalandsbyen
0

Kva er Datalandsbyen?

Resource Description Framework (RDF)
Alle URL-ar til ressursar på data.norge.no kan levere RDF-metadata i fleire ulike format, avhengig av kva for ein Accept-header som blir sendt med.
Les meir om RDF og kva format vi støttar her

Fann du det du leitte etter?

Stortinget Speech Corpus versjon 1.0

Skildring

Distribusjonar1

API-ar som tilbyr dette datasettet0

Liknande datasett

Distribusjonar1

API-ar som tilbyr dette datasettet0

Kontaktinformasjon

Om dataane

Lovheimler

Omgrep brukte i datasettet

Referansar

Gebyr

Om datasettet

Tema

Nøkkelord

Diskusjonar på Datalandsbyen0

Kva er Datalandsbyen?

Resource Description Framework (RDF)Alle URL-ar til ressursar på data.norge.no kan levere RDF-metadata i fleire ulike format, avhengig av kva for ein Accept-header som blir sendt med.Les meir om RDF og kva format vi støttar her

Fann du det du leitte etter?

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Diskusjonar på Datalandsbyen
0

Resource Description Framework (RDF)
Alle URL-ar til ressursar på data.norge.no kan levere RDF-metadata i fleire ulike format, avhengig av kva for ein Accept-header som blir sendt med.
Les meir om RDF og kva format vi støttar her