Hopp til hovedinnhold
Nasjonalbiblioteket

Norsk koreferansekorpus

Beskrivelse

Norwegian-BokmaalNARC og Norwegian-NynorskNARC er konverteringar av høvesvis bokmåls- og nynorskdelen av Norwegian Anaphora Resolution Corpus (NARC), det første offentleg tilgjengelege korpuset annotert med anaforiske relasjonar mellom substantivfrasar for norsk.

Annoteringa er gjort på toppen av og berikar den eksisterande annoteringa til Norsk dependenstrebank (NDT). Korpuset inneheld totalt 15.742 setningar og 245.515 "tokens" for bokmål, og 12.481 setningar og 206.660 "tokens" for nynorsk.

Den vedlagde artikkelen av Mæhlum et al. (frå CRAC 2022) skildrar annoteringsarbeidet i detalj.

Distribusjoner
1

Last ned
Beskrivelse:
Ikke oppgitt
TilgangsURL:
https://hdl.handle.net/21.11146/82
Direkte nedlastning:
https://www.nb.no/sbfil/tekst/NARC_1_1.zip
Genererer forhåndsvisning...
API:
Ikke oppgitt
Dokumentasjon:
Ikke oppgitt
Lisens:
I samsvar med:
Ikke oppgitt

API-er som tilgjengeliggjør dette datasettet
0

Ingen registrerte API-er tilgjengeliggjør dette datasettet.

Lignende datasett

NST uttaleleksikon for svenskNasjonalbiblioteket
Allmenn tilgang
Grafem-til-fonem-modeller for norskNasjonalbiblioteket
Allmenn tilgang
SCARRIE LeksikonNasjonalbiblioteket
Allmenn tilgang
ONOMASTICA uttaleleksikonNasjonalbiblioteket
Allmenn tilgang
N-grammer fra NBdigital 2021Nasjonalbiblioteket
Allmenn tilgang