Hopp til hovudinnhald
Nasjonalbiblioteket

ParlaMint-NO 1.2

  • Datasett
  • Allmenn tilgang 

    Tilgjengeleg for alle. Tilgang kan likevel krevje registrering og førespurnad om API-nøklar, så lenge kven som helst kan be om slik registrering og/eller API-nøklar.

    Les meir om tilgangsnivå her

  • Opne data 

    Datasettet er klassifisert som allmenn tilgang og har minst éi distribuering med godkjend open lisens.

Skildring

ParlaMint-NO er den norske delen av ParlaMint-prosjektet, et EU-finansiert prosjekt støttet av CLARIN-ERIC. Prosjektets mål er å lage sammenlignbare og likt annoterte korpus basert på møtereferat fra ulike lands parlamenter.

Korpuset inneholder referater fra Stortinget for perioden oktober 1998 til mai 2022.

Filformatet er xml i to ulike versjoner:

  • ParlaMint-NO.TEI inneholder referatene annotert med metadata om de ulike talerne.
  • ParlaMint-NO.TEI.ana inneholder de samme dataene annotert på ord- og setningsnivå.

Se dokumentasjonsfilen for mer informasjon om innhold og filformat. Hver av de to delene inneholder referat fra 3.267 møter, og består av om lag 400.000 innlegg og ca. 97,5 mill. ord.

To mindre endringer har blitt gjort i versjon 1.2:

  • Språkkodene er endret fra nob, nno til nb, nn.
  • Mellomrommene i filene har blitt normalisert.

Distribusjonar
1

Namnlaus distribusjon
  • gtar
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/77
Direkte nedlasting:
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt
Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikonNasjonalbiblioteket
Allmenn tilgang
N-grammer fra NBdigital 2021Nasjonalbiblioteket
Allmenn tilgang