Hopp til hovudinnhald
Nasjonalbiblioteket

Norsk koreferansekorpus

Skildring

Norwegian-BokmaalNARC og Norwegian-NynorskNARC er konverteringar av høvesvis bokmåls- og nynorskdelen av Norwegian Anaphora Resolution Corpus (NARC), det første offentleg tilgjengelege korpuset annotert med anaforiske relasjonar mellom substantivfrasar for norsk.

Annoteringa er gjort på toppen av og berikar den eksisterande annoteringa til Norsk dependenstrebank (NDT). Korpuset inneheld totalt 15.742 setningar og 245.515 "tokens" for bokmål, og 12.481 setningar og 206.660 "tokens" for nynorsk.

Den vedlagde artikkelen av Mæhlum et al. (frå CRAC 2022) skildrar annoteringsarbeidet i detalj.

Distribusjonar
1

Namnlaus distribusjon
  • zip
Skildring:
Ikkje oppgitt
Tilgjengeleg URL:
https://hdl.handle.net/21.11146/82
Status:
Ikkje oppgitt
Direkte nedlasting:
API:
Ikkje oppgitt
Dokumentasjon:
Ikkje oppgitt
Lisens:
I samsvar med:
Ikkje oppgitt
Rettigheter for bruk:
Ikkje oppgitt
Last ned

API-ar som tilbyr dette datasettet
0

Ingen registrerte API-ar tilbyr dette datasettet.

Liknande datasett

ONOMASTICA uttaleleksikonNasjonalbiblioteket
Allmenn tilgang
SNOMED CT - engelske termer med oversettelse til bokmål og nynorskNasjonalbiblioteket
Allmenn tilgang
N-gram frå NBdigitalNasjonalbiblioteket
Allmenn tilgang
Tekster fra norsk WikipediaNasjonalbiblioteket
Allmenn tilgang
Omsetjingsminne frå Amesto Translations ASNasjonalbiblioteket
Allmenn tilgang