Hopp til hovedinnhold
Nasjonalbiblioteket

ParlaMint-NO 1.2

  • Datasett
  • Allmenn tilgang 

    Offentlig tilgjengelig for alle. Tilgang kan likevel kreve registrering og forespørsel om API-nøkler, så lenge hvem som helst kan be om slik registrering og/eller API-nøkler.

    Les mer om tilgangsnivåer her

  • Åpne data 

    Datasettet er klassifisert som allmenn tilgang og har minst 1 distribusjon med godkjent åpen lisens.

Beskrivelse

ParlaMint-NO er den norske delen av ParlaMint-prosjektet, et EU-finansiert prosjekt støttet av CLARIN-ERIC. Prosjektets mål er å lage sammenlignbare og likt annoterte korpus basert på møtereferat fra ulike lands parlamenter.

Korpuset inneholder referater fra Stortinget for perioden oktober 1998 til mai 2022.

Filformatet er xml i to ulike versjoner:

  • ParlaMint-NO.TEI inneholder referatene annotert med metadata om de ulike talerne.
  • ParlaMint-NO.TEI.ana inneholder de samme dataene annotert på ord- og setningsnivå.

Se dokumentasjonsfilen for mer informasjon om innhold og filformat. Hver av de to delene inneholder referat fra 3.267 møter, og består av om lag 400.000 innlegg og ca. 97,5 mill. ord.

To mindre endringer har blitt gjort i versjon 1.2:

  • Språkkodene er endret fra nob, nno til nb, nn.
  • Mellomrommene i filene har blitt normalisert.

Distribusjoner
1

Navnløs distribusjon
  • gtar
Beskrivelse:
Ikke oppgitt
TilgangsURL:
https://hdl.handle.net/21.11146/77
Direkte nedlastning:
API:
Ikke oppgitt
Dokumentasjon:
Ikke oppgitt
Lisens:
I samsvar med:
Ikke oppgitt
Last ned

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikonNasjonalbiblioteket
Allmenn tilgang
N-grammer fra NBdigital 2021Nasjonalbiblioteket
Allmenn tilgang