Hopp til hovedinnhold
Nasjonalbiblioteket

Norsk koreferansekorpus

Beskrivelse

Norwegian-BokmaalNARC og Norwegian-NynorskNARC er konverteringar av høvesvis bokmåls- og nynorskdelen av Norwegian Anaphora Resolution Corpus (NARC), det første offentleg tilgjengelege korpuset annotert med anaforiske relasjonar mellom substantivfrasar for norsk.

Annoteringa er gjort på toppen av og berikar den eksisterande annoteringa til Norsk dependenstrebank (NDT). Korpuset inneheld totalt 15.742 setningar og 245.515 "tokens" for bokmål, og 12.481 setningar og 206.660 "tokens" for nynorsk.

Den vedlagde artikkelen av Mæhlum et al. (frå CRAC 2022) skildrar annoteringsarbeidet i detalj.

Distribusjoner
1

Last ned
Beskrivelse:
Ikke oppgitt
TilgangsURL:
https://hdl.handle.net/21.11146/82
Direkte nedlastning:
https://www.nb.no/sbfil/tekst/NARC_1_1.zip
Genererer forhåndsvisning...
API:
Ikke oppgitt
Dokumentasjon:
Ikke oppgitt
Lisens:
I samsvar med:
Ikke oppgitt

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
N-grammer fra NBdigital 2021Nasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikon 2Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang