Hopp til hovudinnhald
Nasjonalbiblioteket

Norsk koreferansekorpus

Skildring

Norwegian-BokmaalNARC og Norwegian-NynorskNARC er konverteringar av høvesvis bokmåls- og nynorskdelen av Norwegian Anaphora Resolution Corpus (NARC), det første offentleg tilgjengelege korpuset annotert med anaforiske relasjonar mellom substantivfrasar for norsk.

Annoteringa er gjort på toppen av og berikar den eksisterande annoteringa til Norsk dependenstrebank (NDT). Korpuset inneheld totalt 15.742 setningar og 245.515 "tokens" for bokmål, og 12.481 setningar og 206.660 "tokens" for nynorsk.

Den vedlagde artikkelen av Mæhlum et al. (frå CRAC 2022) skildrar annoteringsarbeidet i detalj.

Distribusjonar
1

Last ned
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/82
Direkte nedlasting:
https://www.nb.no/sbfil/tekst/NARC_1_1.zip
Genererer førehandsvising...
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

Norsk ordbank - nynorsk 2005-2012Nasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikon 2Nasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Semantix ASNasjonalbiblioteket
Allmenn tilgang
NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
spaCy for nynorskNasjonalbiblioteket
Allmenn tilgang