Hopp til hovudinnhald
Nasjonalbiblioteket

NB Samtale

Skildring

NB Samtale er et talekorpus med ortografisk transkribert lydmateriale hentet fra podkaster og opptak av arrangementer på Nasjonalbiblioteket. Korpuset inneholder samtaler mellom flere personer, og talen er spontan og har typiske trekk ved muntlig språk. Lydmaterialet er valgt ut med tanke på god balanse mellom kjønnene og god dialektvariasjon, og korpuset har transkripsjoner på både bokmål og nynorsk.

NB Samtale er tenkt som et open-source-datasett for trening av automatisk talegjenkjenning, spesifikt gjenkjenning av spontan tale mellom flere personer i samtale. Det er til sammen 24 timer transkribert tale fra 69 talere fordelt på 12.080 segmenter som hver er en individuell WAV-fil. Metadataene inneholder blant annet informasjon om segmentenes kildefil, tidskode og varighet, samt talernes kjønn, dialekt og målform.

NB Samtale er utviklet av Språkbanken ved Nasjonalbiblioteket. Vi setter stor pris på tilbakemeldinger og forslag til forbedringer. Kontakt oss på sprakbanken@nb.no.

Distribusjonar
1

Last ned
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/85
Direkte nedlasting:
  1. https://www.nb.no/sbfil/taledata/nb_samtale.zip
    Genererer førehandsvising...
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
spaCy for nynorskNasjonalbiblioteket
Allmenn tilgang
Diskusjonstekster frå WikipediaNasjonalbiblioteket
Allmenn tilgang