Hopp til hovudinnhald
Nasjonalbiblioteket

NB Samtale

  • Datasett
  • Allmenn tilgang 

    Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.

    Les meir om tilgangsnivå her

  • Opne data 

    Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

Skildring

NB Samtale er et talekorpus med ortografisk transkribert lydmateriale hentet fra podkaster og opptak av arrangementer på Nasjonalbiblioteket. Korpuset inneholder samtaler mellom flere personer, og talen er spontan og har typiske trekk ved muntlig språk. Lydmaterialet er valgt ut med tanke på god balanse mellom kjønnene og god dialektvariasjon, og korpuset har transkripsjoner på både bokmål og nynorsk.

NB Samtale er tenkt som et open-source-datasett for trening av automatisk talegjenkjenning, spesifikt gjenkjenning av spontan tale mellom flere personer i samtale. Det er til sammen 24 timer transkribert tale fra 69 talere fordelt på 12.080 segmenter som hver er en individuell WAV-fil. Metadataene inneholder blant annet informasjon om segmentenes kildefil, tidskode og varighet, samt talernes kjønn, dialekt og målform.

NB Samtale er utviklet av Språkbanken ved Nasjonalbiblioteket. Vi setter stor pris på tilbakemeldinger og forslag til forbedringer. Kontakt oss på sprakbanken@nb.no.

Distribusjonar
1

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

ONOMASTICA uttaleleksikonNasjonalbiblioteket
Allmenn tilgang
SNOMED CT - engelske termer med oversettelse til bokmål og nynorskNasjonalbiblioteket
Allmenn tilgang
N-gram frå NBdigitalNasjonalbiblioteket
Allmenn tilgang
Tekster fra norsk WikipediaNasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Amesto Translations ASNasjonalbiblioteket
Allmenn tilgang