Status: Fases ut
Publisert: 11.10.2016
Oppdatert: 22.10.2020
Lenke til gjeldende versjon: https://data.norge.no/specification/dcat-ap-no/

Denne versjonen av DCAT-AP-NO er på vei ut og vil ikke bli vedlikeholdt (inkl. ev. kjente feil/mangler). Vi oppfordrer sterkt til å bruke DCAT-AP-NO v.2.0+.

Dette dokumentet beskriver “Standard for beskrivelse av datasett og datakataloger (DCAT-AP-NO)” som skal sikre at beskrivelser av offentlige data utføres på en felles, strukturert måte og i en maskinlesbar form. Standarden stiller krav til hva som skal, bør og kan være med i beskrivelsene, med spesifikasjon av dataformat.

Innledning

Formålet med standarden er å legge til rette for utveksling av beskrivelser av datasett, og å lette søk etter datasett. Standarden vil gjelde datasett som forvaltes av offentlig sektor, og som beskrives med tanke på oppføring i en katalog eller «inventarliste». Standarden vil støtte søking i og deling av datasett på tvers av offentlig sektor (gjenbruk) og legge til rette for viderebruk i privat sektor. Standarden er således nyttig både for offentlig sektor selv og for næringsliv og sivilsamfunn for øvrig.

Ettersom standarden anbefaler formater som er beregnet for bruk i et Lenkede data-miljø, bør utgivere vurdere følgende anbefalinger fra W3C: Best Practice Recipes for Publishing RDF Vocabularies, Best Practices for Publishing Linked Data og ISA-rapporten 10 Rules for Persistent URIs. Utgivere bør også vurdere å tildele URIer til alle forekomster av klassene som er beskrevet i standarden.

Digitaliseringsdirektoratet har utredet behovet for anbefalte og obligatoriske standarder for pekere til offentlige ressurser på nett. Les mer

Språk skal angis for alle literaler i tråd med ISO 639.

DCAT-AP-NO er basert på den europeiske DCAT-profilen DCAT application profile for data portals in Europe som er forvaltet av EU-kommisjonens ISA-program.

Egenskapsnavnene fra den underliggende DCAT-AP er i denne standarden gitt norske navn. Siden standarden legger til rette for internasjonal utveksling, skal engelske egenskapsnavn i form av URIer benyttes.

Avvik fra EUs DCAT-AP

Denne versjonen av standarden (DCAT-AP-NO versjon 1.1) avviker fra den underliggende DCAT-AP versjon 1.1 på følgende punkter:

  1. Datasett: utgiver er endret fra anbefalt til obligatorisk egenskap. Anbefaling om bruk av autoritativ URI eller organisasjonsnummer er lagt til i beskrivelsen.

  2. Datasett: tema er endret fra anbefalt til obligatorisk egenskap. Los er lagt til som anbefalt vokabular i beskrivelsen.

  3. Datasett: identifikator er endret fra valgfri til obligatorisk egenskap. Beskrivelsen er endret fra å være unik i kontekst av katalogen til en stabil og globalt unik identifikator

  4. for egenskapen Datasett: dekningsområde er anbefalingen om bruk av vokabularene MDR Continents Named Authority List, MDR Countries Named Authority List og MDR Places Named Authority List fjernet. Beskrivelsen er endret til: Referanse, primært i form av en URI for et administrativt område, eller navn på sted eller område hentet fra et kontrollert vokabular (for eksempel Sentralt stedsnavnregister), eller geografiske koordinater (EU89) for området datasettet gjelder for (punkt eller geografisk grenseramme jf ISO 19115)

  5. Datasett: tilgangsnivå er endret fra valgfri til anbefalt egenskap

  6. Datasett: skjermingshjemmel er lagt til som ny anbefalt egenskap

  7. Datasett: begrep er lagt til som ny anbefalt egenskap

  8. Datasett: skaper (opphavsorganisasjon) er lagt til som ny valgfri egenskap

  9. relasjonene Datasett: er del av og Datasett: har del er lagt til som nye valgfrie egenskaper

  10. relasjonene Datasett: krever og Datasett: er påkrevd av er lagt til som nye valgfrie egenskaper

  11. relasjonene Datasett: erstatter og Datasett: erstattes av er lagt til som nye valgfrie egenskaper

  12. relasjonene Datasett: refererer til og Datasett: er referert av er lagt til som nye valgfrie egenskaper

  13. Distribusjon: format er endret fra anbefalt til obligatorisk og er samtidig endret til å tillate flere verdier (1..n). Beskrivelsen er endret til: IANA Media Types skal brukes. Formater som ikke er på IANA-listen legges til etter samme struktur.

  14. egenskapen mediatype er fjernet fordi egenskapen Distribusjon: format er vurdert til å dekke behovet

  15. egenskapen Enhet: organisasjonsidentifikator er lagt til som ny egenskap

  16. JSON-LD er lagt til som anbefalt publiseringsformat i tillegg til RDF/XML

  17. Egenskapene er gitt norske navn (URIer skal brukes - ikke navnet på egenskapene)

Omfang og avgrensing

Standarden er anbefalt brukt for å beskrive datasett og datakataloger i offentlig sektor. Den vil gjelde for alle datasett i offentlig sektor (inkludert åpne data) som beskrives med tanke på oppføring i en katalog eller «inventarliste» (intern eller ekstern). Standarden er ikke tenkt brukt for å beskrive dokumenter eller fagsystem.

Forvaltningsregime

Utarbeidelse av nye versjoner av «Standard for beskrivelse av datakataloger og datasett» initieres av Digitaliseringsdirektoratet, og den primære kilden til nye versjoner vil være endringer i DCAT-AP. Digitaliseringsdirektoratet vil derfor ha ansvar for å følge med på EUs bruk av, og endringsarbeid knyttet til, DCAT-AP. Arbeidet med en ny versjon av den nasjonale standarden skal som vanlig forankres i relevante organer via høring og behandling i Standardiseringsrådet (som har endret sitt navn til Arkitektur- og standardiseringsrådet).

Digitaliseringsdirektoratet vil i forbindelse med nye versjoner av DCAT-AP avgjøre om endringene er så store at det bør nedsettes en egen arbeidsgruppe bestående av relevante aktører, eller om revisjonen kan utføres av Digitaliseringsdirektoratet selv. Forslaget til ny versjon sendes uansett på høring. De innkomne høringskommentarene behandles hos Digitaliseringsdirektoratet, og resulterer i et forslag som oversendes Arkitektur- og standardiseringsrådet.

Digitaliseringsdirektoratet ønsker å gi brukerne mulighet til å gi tilbakemeldinger og innspill til standarden via Digitaliseringsdirektoratets nettsider. Slike innspill vil tas med inn i arbeidet med revisjoner initiert av nye DCAT-AP- versjoner, men Digitaliseringsdirektoratet vil også vurdere tilbakemeldingene en gang i året, for å se om noen av dem bør føre til oppdateringer utenom disse større revisjonene. Dette kan være aktuelt blant annet fordi den nasjonale standarden har noen tillegg til DCAT-AP som for eksempel kan vurderes.

Dersom det oppdages mindre feil i standarden (stavefeil etc), vil ikke korrigering av disse utløse en ny versjon. Disse korrigeringene skal imidlertid dokumenteres i et vedlegg som følger den aktuelle standarden.

Gjeldende og eventuelle tidligere versjoner av standarden skal være tilgjengelige på Digitaliseringsdirektoratets nettsider, slik at det er enkelt å finne ut når tidligere versjoner var gyldige, og hvilke endringer som er foretatt mellom to versjoner.

Ord, uttrykk og forkortelser

Datasett

Et datasett er en samling med data (for eksempel i form av en tabell, liste eller en database) som kan gjøres tilgjengelig som en nedlastbar fil, og/eller nåes via et Web-API.

Datakatalog

En datakatalog gjør det mulig å finne opplysninger om datasett, hvem som forvalter dem og hvordan de eventuelt er gjort tilgjengelig for andre. Datakatalogen kan inneholde beskrivelser av alle virksomhetens datasett, uavhengig av om de er distribuert som fil for nedlasting, gjennom et Web API eller om distribusjon ikke eksisterer.

Web API

Web Application Programming Interface gjør at dataprogrammer kan gjøre oppslag i et datasett ved hjelp av World Wide Web. For eksempel kan et datasett over bomstasjoner i Norge bli gjort tilgjengeleg for utviklere gjennom en web-API, slik at et dataprogram kan bruke kommunenummer for å hente en liste over alle bomstasjoner i en kommune.

Distribusjon

En distribusjon er en spesifikk måte å gjøre et datasettet tilgjengelig på. Hvert datasett kan være tilgjengelig på flere måter, for eksempel i ulike format eller fra ulike nettadresser. Eksempel på distribusjoner kan være nedlastbar CSV-fil, et API eller en RSS-strøm.

Åpne data

Åpne data er digitale data som er gjort tilgjengelig med de tekniske og juridiske egenskaper som er nødvendige for at de skal kunne brukes fritt, og bli distribuert av hvem som helst, når som helst og hvor som helst.

RDF

Resource Description Framework. En gruppe W3C-spesifikasjoner som beskriver en modell for å representere metadata (data om data). Spesifikasjonene brukes i mange ulike sammenhenger for å beskrive informasjon og er et viktig element i visjonen om den semantiske webben.

DCAT

Data Catalog Vocabulary. Et RDF-vokabular utviklet av W3C for å forenkle samhandling mellom datakataloger som er publisert på nettet.

DCAT-AP

DCAT Application profile for data portals in Europe. En spesifikasjon basert på DCAT for å beskrive offentlige datasett i Europa

DCAT-AP-NO

Kortnavnet på denne standarden ("Standard for beskrivelse av datasett og datakataloger").

JSON-LD

JavaScript Object Notation for Linked Data. En JSON-basert serialisering av RDF. Anbefalt av W3C i januar 2014

URI

Uniform Resource Identifier en kompakt streng av tegn som identifiserer en abstrakt eller fysisk ressurs

Klasser i standarden

Enhet

Engelsk

Agent

Beskrivelse

Enhet som er assosiert med katalogen og/eller datasettene. Dersom enheten er en organisasjon er det anbefalt å bruke «Organization Ontology»

URI

foaf:Agent

Referanse

http://xmlns.com/foaf/spec/#term_Agent , http://www.w3.org/TR/vocab-org/

Status

Obligatorisk

Kategori

Engelsk

Category

Beskrivelse

Et emne for et datasett

URI

SKOS:Concept

Referanse

http://www.w3.org/TR/2013/WD-vocab-dcat-20130312/#class-category-and-category-scheme

Status

Obligatorisk

Kategoriskjema

Engelsk

Category scheme

Beskrivelse

En samling begreper (for eksempel et kontrollert vokabular) hvor kategorien er definert

URI

SKOS:ConceptScheme

Referanse

http://www.w3.org/TR/2013/WD-vocab-dcat-20130312/#class-category-and-category-scheme

Status

Obligatorisk

Katalog

Engelsk

Catalogue

Beskrivelse

En katalog eller repository som inneholder beskrivelsene av datasettene som er beskrevet.

URI

dcat:Catalog

Referanse

http://www.w3.org/TR/2013/WD-vocab-dcat-20130312/#class-catalog

Status

Obligatorisk

Datasett

Engelsk

Dataset

Beskrivelse

En konseptuell enhet som representerer informasjonen som publiseres

URI

dcat:Dataset

Referanse

http://www.w3.org/TR/2013/WD-vocab-dcat-20130312/#class-dataset

Status

Obligatorisk

Literal

Engelsk

Literal

Beskrivelse

En literal-verdi slik som en streng eller heltall (integer). Literaler kan inneholde datatype, og for eksempel være formatert som en dato. Literaler som innholder maskinlesbar tekst har en valgfri språk-tag, definert av BCP47 (no=norsk, nb=bokmål, nn=nynorsk, en=engelsk)

URI

rdfs:Literal

Referanse

https://www.w3.org/TR/2014/REC-rdf11-concepts-20140225/#section-Graph-Literal

Status

Obligatorisk

Ressurs

Engelsk

Resource

Beskrivelse

Hva som helst som er beskrevet med RDF

URI

rdfs:Resource

Referanse

http://www.w3.org/TR/rdf-schema/#ch_resource

Status

Obligatorisk

Distribusjon

Engelsk

Distribution

Beskrivelse

En fysisk utførelse av datasettet i et bestemt format.

URI

dcat:Distribution

Referanse

http://www.w3.org/TR/2013/WD-vocab-dcat-20130312/#class-distribution

Status

Anbefalt

Lisensdokument

Engelsk

License document

Beskrivelse

En juridisk dokument som gir offisiell tillatelse til å gjøre noe med en ressurs.

URI

dct:LicenseDocument

Referanse

http://dublincore.org/documents/2012/06/14/dcmi-terms/?v=terms#LicenseDocument

Status

Anbefalt

Katalogpost

Engelsk

Catalogue Record

Beskrivelse

En beskrivelse av en datasettoppføring i katalogen.

URI

dcat:CatalogRecord

Referanse

http://www.w3.org/TR/2013/WD-vocab-dcat-20130312/#class-catalog-record

Status

Valgfri

Sjekksum

Engelsk

Checksum

Beskrivelse

En beskrivelse som muliggjør autentisering av en fil. Flere sjekksumtyper og kryptografiske algoritmer kan brukes.

URI

spdx:Checksum

Referanse

http://spdx.org/rdf/terms#Checksum

Status

Valgfri

Dokument

Engelsk

Document

Beskrivelse

En tekstlig ressurs beregnet på mennesker som inneholder informasjon. For eksempel en nettside om et datasett.

URI

foaf:Document

Referanse

http://xmlns.com/foaf/spec/#term_Document

Status

Valgfri

Frekvens

Engelsk

Frequency

Beskrivelse

Hvor ofte noe skjer, for eksempel publisering av et datasett.

URI

dct:Frequency

Referanse

http://dublincore.org/documents/dcmi-terms/#terms-Frequency

Status

Valgfri

Identifikator

Engelsk

Identifier

Beskrivelse

En identifikator i en bestemt kontekst, bestående av strengen som er identifikatoren; en valgfri identifikator for identifikatorsystemet; en valgfri identifikator for versjonen av identifikatorsystemet; en valgfri identifikator for etaten som administrerer identifikatorsystemet

URI

adms:Identifier

Referanse

http://www.w3.org/TR/vocab-adms/#identifier

Status

Valgfri

Kontaktpunkt

Engelsk

Kind

Beskrivelse

En beskrivelse av et kontaktpunkt i henhold til vCard spesifikasjonen. Her kan man for eksempel oppgi telefonnr og/eller epost. Merk at beskrivelsen må være en instans av en av fire typer: individ, organisasjon, lokasjon eller gruppe.

URI

vcard:Kind

Referanse

http://www.w3.org/TR/2014/NOTE-vcard-rdf-20140522/#d4e181

Status

Valgfri

Språksystem

Engelsk

Linguistic system

Beskrivelse

Et system av tegn, symboler, lyder, gester, eller regler som brukes i kommunikasjon, for eksempel et språk

URI

dct:LinguisticSystem

Referanse

http://dublincore.org/documents/dcmi-terms/#terms-LinguisticSystem

Status

Valgfri

Lokasjon

Engelsk

Location

Beskrivelse

En region eller et navngitt sted. Det kan representeres ved hjelp av et kontrollert vokabular eller med geografiske koordinater.

URI

dct:Location

Referanse

http://dublincore.org/documents/dcmi-terms/#terms-Location

Status

Valgfri

Mediatype eller omfang

Engelsk

Media type or extent

Beskrivelse

En medietype eller omfang, for eksempel formatet til en datafil

URI

dct:MediaTypeOrExtent

Referanse

http://dublincore.org/documents/dcmi-terms/#terms-MediaTypeOrExtent

Status

Valgfri

Tidsrom

Engelsk

Period of time

Beskrivelse

Et tidsintervall som er navngitt eller definert av en start- og sluttdato.

URI

dct:PeriodOfTime

Referanse

http://dublincore.org/documents/dcmi-terms/#terms-PeriodOfTime

Status

Valgfri

Utgivertype

Engelsk

Publisher type

Beskrivelse

Type organisasjon som fungerer som en utgiver

URI

skos:Concept

Referanse

http://www.w3.org/TR/vocab-adms/#dcterms-type

Status

Valgfri

Rettighetsutsagn

Engelsk

Rights statement

Beskrivelse

En utsagn om immaterielle rettigheter knyttet til en ressurs, et juridisk dokument som gir offisiell tillatelse til å gjøre noe med en ressurs, eller en uttalelse om tilgangsrettigheter.

URI

dct:RightsStatement

Referanse

http://dublincore.org/documents/dcmi-terms/#terms-RightsStatement

Status

Valgfri

Standard

Engelsk

Standard

Beskrivelse

En standard eller annen spesifikasjon som et datasett er i samsvar med

URI

dct:Standard

Referanse

http://dublincore.org/documents/dcmi-terms/#terms-Standard

Status

Valgfri

Status

Engelsk

Status

Beskrivelse

En indikasjon på modenhet for en distribusjon

URI

skos:Concept

Referanse

http://www.w3.org/TR/vocab-adms/#status

Status

Valgfri

Opphav

Engelsk

ProvenanceStatement

Beskrivelse

En beskrivelse av opphavet, eierforhold og endringer i eierforholdet til en ressurs. Skal brukes til å vurdere autentisitet, integritet og autorisasjon.

URI

skos:Concept

Referanse

http://www.w3.org/TR/vocab-adms/#status

Status

Valgfri

URIer som er i bruk

Diagram

UML-diagram over alle klassene og egenskapene i DCAT-AP-NO

dcat ap no 1.1p3

Egenskaper pr. klasse

Katalog

Egenskaper for klassen Katalog (obligatorisk):

Katalog: datasett

URI

dcat:dataset

Range

dcat:Dataset

Beskrivelse

Kobler katalogen til datasett som er en del av katalogen

Kardinalitet

1..n

Status

Obligatorisk

Katalog: beskrivelse

URI

dct:description

Range

rdfs:Literal

Beskrivelse

Fritekst-beskrivelse av innholdet i katalogen. Egenskapen kan bli gjentatt for parallelle språkversjoner av beskrivelsen.

Kardinalitet

1..n

Status

Obligatorisk

Katalog: utgiver

URI

dct:publisher

Range

foaf:Agent

Beskrivelse

Refererer til en enhet (organisasjon) som er ansvarlig for å gjøre katalogen tilgjengelig. Bør være autoritativ URI for enhet, sekundært organisasjonsnummer.

Kardinalitet

1..1

Status

Obligatorisk

Katalog: tittel

URI

dct:title

Range

rdfs:Literal

Beskrivelse

Inneholder navnet på katalogen. Egenskapen kan bli gjentatt for parallelle språkversjoner av navnet.

Kardinalitet

1..n

Status

Obligatorisk

Katalog: hjemmeside

URI

foaf:homepage

Range

foaf:Document

Beskrivelse

Nettside som fungerer som hovedside for katalogen

Kardinalitet

0..1

Status

Anbefalt

Katalog: språk

URI

dct:language

Range

dct:LinguisticSystem

Beskrivelse

Viser til et språk som brukes i tekstlige metadata som beskriver titler, beskrivelser, osv av datasettene i katalogen. Egenskapen kan gjentas hvis metadata er gitt i flere språk.

Kardinalitet

0..n

Status

Anbefalt

Katalog: lisens

URI

dct:license

Range

dct:LicenseDocument

Beskrivelse

Viser til lisens for datakatalogen som beskriver hvordan den kan viderebrukes.

Kardinalitet

0..1

Status

Anbefalt

Katalog: utgivelsesdato

URI

dct:issued

Range

rdfs:Literal typed as xsd:date or xsd:dateTime

Beskrivelse

Dato for formell utgivelse (publisering) av katalogen.

Kardinalitet

0..1

Status

Anbefalt

Katalog: temaer

URI

dcat:themeTaxonomy

Range

skos:ConceptScheme

Beskrivelse

Refererer til et kunnskapsorganiseringssystem (KOS) som er brukt for å klassifisere katalogens datasett

Kardinalitet

0..n

Status

Anbefalt

Katalog: endringsdato

URI

dct:modified

Range

rdfs:Literal typed as xsd:date or xsd:dateTime

Beskrivelse

Dato for siste oppdatering/endring av katalogen

Kardinalitet

0..1

Status

Anbefalt

Katalog: er del av

URI

dct:isPartOf

Range

dcat:Catalog

Beskrivelse

Refereranse til en beslektet katalog som denne katalogen er fysisk eller logisk inkludert i

Kardinalitet

0..1

Status

Valgfri

Katalog: har del

URI

dct:hasPart

Range

dcat:Catalog

Beskrivelse

Referanse til en beslektet katalog som er en del av den beskrevne katalogen

Kardinalitet

0..n

Status

Valgfri

Katalog: katalogpost

URI

dcat:record

Range

dcat:CatalogRecord

Beskrivelse

Refererer til en katalogpost som er del av katalogen

Kardinalitet

0..n

Status

Valgfri

Katalog: rettigheter

URI

dct:rights

Range

dct:RightsStatement

Beskrivelse

Uttalelse som spesifiserer rettigheter knyttet til katalogen

Kardinalitet

0..1

Status

Valgfri

Katalog: dekningsområde

URI

dct:spatial

Range

dct:Location

Beskrivelse

Referanse til et geografisk område som er dekket av katalogen

Kardinalitet

0..n

Status

Valgfri

Katalogpost

Egenskaper for klassen Katalogpost (valgfri)

Katalogpost: primærtema

URI

foaf:primaryTopic

Range

dcat:Dataset

Beskrivelse

Denne egenskapen lenker katalogposten til datasettet som er beskrevet i katalogposten

Kardinalitet

1..1

Status

Obligatorisk

Katalogpost: endringsdato

URI

dct:modified

Range

rdfs:Literal typed as xsd:date or xsd:dateTime

Beskrivelse

Denne egenskapen inneholder den nyeste datoen for når katalogposten ble endret.

Kardinalitet

1..1

Status

Obligatorisk

Katalogpost: i samsvar med

URI

dct:conformsTo

Range

rdfs:Resource

Beskrivelse

Referanse til en applikasjonsprofil som datasettets metadata er i samsvar med

Kardinalitet

0..1

Status

Anbefalt

Katalogpost: endringstype

URI

adms:status

Range

skos:Concept

Beskrivelse

Type endring for siste revisjon av en datasettbeskrivelse i katalogen. MÅ ha en av verdiene :created, :updated eller :deleted avhengig av om denne siste revisjonen er et resultat av en ny post, oppdatering eller sletting.

Kardinalitet

0..1

Status

Anbefalt

Katalogpost: utlistingsdato

URI

dct:issued

Range

rdfs:Literal typed as xsd:date or xsd:dateTime

Beskrivelse

Datoen for når beskrivelsen av datasettet ble inkludert i datakatalogen.

Kardinalitet

0..1

Status

Anbefalt

Katalogpost: beskrivelse

URI

dct:description

Range

rdfs:Literal

Beskrivelse

Inneholder en fritekstbeskrivelse av katalogposten. Denne egenskapen kan gjentas for parallelle språkversjoner av beskrivelsen.

Kardinalitet

0..n

Status

Valgfri

Katalogpost: språk

URI

dct:language

Range

dct:LinguisticSystem

Beskrivelse

Refererer til et språk som er brukt i tekstlige metadata som beskriver tittel, beskrivelser osv. av datasettene i katalogen. Egenskapen kan repeteres dersom metadata er oppgitt på flere språk

Kardinalitet

0..n

Status

Valgfri

Katalogpost: kilde

URI

dct:source

Range

dcat:CatalogRecord

Beskrivelse

Referanse til den originale katalogposten (metadata) som er brukt for å skape denne katalogposten (metadata) for datasettet

Kardinalitet

0..n

Status

Valgfri

Katalogpost: tittel

URI

dct:title

Range

rdfs:Literal

Beskrivelse

Navnet på katalogen. Denne egenskapen kan gjentas for parallelle språkversjoner av navnet.

Kardinalitet

0..n

Status

Valgfri

Datasett

Egenskaper for klassen Datasett (obligatorisk)

Datasett: beskrivelse

URI

dct:description

Range

rdfs:Literal

Beskrivelse

Inneholder fritekstbeskrivelse av datasettet. Kan gjentas for parallelle språkversjoner

Kardinalitet

1..n

Status

Obligatorisk

Datasett: tittel

URI

dct:title

Range

rdfs:Literal

Beskrivelse

Inneholder navnet på datasettet. Kan gjentas for parallelle språkversjoner av navnet

Kardinalitet

1..n

Status

Obligatorisk

Datasett: identifikator

URI

dct:identifier

Range

rdfs:Literal

Beskrivelse

Hovedidentifikator for datasettet, for eksempel en URI eller annen identifikator som er stabil og globalt unik

Kardinalitet

1..n

Status

Obligatorisk

Kommentar

Her har Norge valgt å gjøre en innskjerping (i forhold til EU) ved å si at ethvert datasett skal ha minst én hovedidentifikator. Denne kan for eksempel være URI’en eller annen identifikator som er globalt unik (ikke bare innenfor DCAT-katalogen).

Datasett: tema

URI

dcat:theme, subproperty of dct:subject

Range

skos:Concept

Beskrivelse

Referanse til et hovudtema for datasettet. Et datasett kan assosieres med flere tema. Bruk av vokabularet Data theme som er publisert av EUs Publication Offices er påkrevd. Bruk av Digitaliseringsdirektoratets Los-vokabular er anbefalt. Også andre nasjonale og internasjonale vokabular kan brukes om de oppfyller denne standardens krav til kontrollerte vokabular.

Kardinalitet

1..n

Status

Obligatorisk

Datasett: utgiver

URI

dct:publisher

Range

foaf:Agent

Beskrivelse

Referanse til en enhet (organisasjon) som er ansvarlig for å gjøre datasettet tilgjengelig. Bør være autoritativ URI for enhet, sekundært organisasjonsnummer.

Kardinalitet

1..1

Status

Obligatorisk

Datasett: kontaktpunkt

URI

dcat:contactPoint

Range

vcard:Kind

Beskrivelse

Referanse til kontaktpunktsobjekt med kontaktopplysninger. Disse kan brukes til å sende kommentarer om datasettet.

Kardinalitet

0..n

Status

Anbefalt

Datasett: datasettdistribusjon

URI

dcat:distribution

Range

dcat:Distribution

Beskrivelse

Koblingen mellom datasettet og en tilgjengelig distribusjon

Kardinalitet

0..n

Status

Anbefalt

Datasett: emneord

Range

rdfs:Literal

URI

dcat:keyword

Beskrivelse

Inneholder emneord (eller tag) som beskriver datasettet

Kardinalitet

0..n

Status

Anbefalt

Datasett: tilgangsnivå

URI

dct:accessRights

Range

dct:RightsStatement

Beskrivelse

Dette feltet angir i hvilken grad datasettet kan bli gjort tilgjengelig for allmennheten, uten hensyn til om det er publisert eller ikke. Et kontrollert vokabular med tre verdier (:public, :restricted og :non-public) vil bli opprettet og forvaltet av EUs Publication Office. Ved bruk av verdiene ":restricted" og ":non-public" er egenskapen skjermingshjemmel anbefalt.

Kardinalitet

0..1

Status

Anbefalt

Datasett: skjermingshjemmel

URI

dcatno:accessRightsComment

Range

skos:Concept

Beskrivelse

Referanse til hjemmel (kilde for påstand) i offentlighetsloven, sikkerhetsloven, beskyttelsesinstruksen eller annet lovverk som ligger til grunn for vurdering av tilgangsnivå. Egenskapen er anbefalt dersom «tilgangsnivå» har verdiene «restricted» eller «non-public»

Kardinalitet

0..n

Status

Anbefalt

Kommentar

Norsk utvidelse. Et eget vokabular skal publiseres av Digitaliseringsdirektoratet.

Datasett: begrep

URI

dct:subject

Range

skos:Concept

Beskrivelse

Referanse til sentrale begrep som er viktige for å forstå og tolke datasettet. Representeres som URI-er.

Kardinalitet

0..n

Status

Anbefalt

Kommentar

Norsk utvidelse

Datasett: i samsvar med

URI

dct:conformsTo

Range

dct:Standard

Beskrivelse

Referanse til en implementasjons-regel eller annen spesifikasjon, som ligger til grunn for opprettelsen av datasettet

Kardinalitet

0..n

Status

Valgfri

Datasett: dokumentasjon

URI

foaf:page

Range

foaf:Document

Beskrivelse

Referanse til en side eller et dokument som beskriver datasettet

Kardinalitet

0..n

Status

Valgfri

Datasett: frekvens

URI

dct:accrualPeriodicity

Range

dct:Frequency

Beskrivelse

Referanse (URI) til oppdateringsfrekvensen for datasettet. Skal peke på begrep fra Frequency Name Authority List som vedlikeholdes av Publications Office.

Kardinalitet

0..1

Status

Valgfri

Datasett: har versjon

URI

dct:hasVersion

Range

dcat:Dataset

Beskrivelse

Referanse til et datasett som er en versjon, utgave, eller tilpasning av det beskrevne datasettet

Kardinalitet

0..n

Status

Valgfri

Datasett: er versjon av

URI

dct:isVersionOf

Range

dcat:Dataset

Beskrivelse

Referanse til et beslektet datasett som det beskrevne datasettet er en versjon, utgave, eller tilpasning av

Kardinalitet

0..n

Status

Valgfri

Datasett: landingsside

URI

dcat:landingPage

Range

foaf:Document

Beskrivelse

Referanse til nettside som gir tilgang til datasettet, dets distribusjoner og/eller tilleggsinformasjon. Intensjonen er å peke til en landingsside hos den opprinnelige datautgiveren.

Kardinalitet

0..n

Status

Valgfri

Datasett: språk

URI

dct:language

Range

dct:LinguisticSystem

Beskrivelse

Referanse til språket som datasettet er på. Kan repeteres dersom det er flere språk i datasettet

Kardinalitet

0..n

Status

Valgfri

Datasett: annen identifikator

URI

adms:identifier

Range

adms:Identifier

Beskrivelse

Referanse til en sekundær identifikator av datasettet som MAST/ADS, DataCite, DOI, EZID eller W3ID.

Kardinalitet

0..n

Status

Valgfri

Datasett: opphav

URI

dct:provenance

Range

dct:ProvenanceStatement

Beskrivelse

Referanse til objekt som beskriver hvor datasettet kommer fra, hvordan det er produsert og hvilken kvalitet det har

Kardinalitet

0..1

Status

Valgfri

Datasett: relatert ressurs

URI

dct:relation

Range

rdfs:Resource

Beskrivelse

Referanse til en beslektet ressurs

Kardinalitet

0..n

Status

Valgfri

Datasett: utgivelsesdato

URI

dct:issued

Range

rdfs:Literal typed as xsd:dateTime

Beskrivelse

Dato for den formelle utgivelsen av datasettet

Kardinalitet

0..1

Status

Valgfri

Datasett: eksempeldata

URI

adms:sample

Range

dcat:Distribution

Beskrivelse

Referanse til eksempeldata

Kardinalitet

0..n

Status

Valgfri

Datasett: kilde

URI

dct:source

Range

dcat:Dataset

Beskrivelse

Referanse til et datasett som gjeldende datasett er avledet fra

Kardinalitet

0..n

Status

Valgfri

Datasett: dekningsområde

URI

dct:spatial

Range

dct:Location

Beskrivelse

Referanse, primært i form av en URI for et administrativt område, eller navn på sted eller område hentet fra et kontrollert vokabular (for eksempel Sentralt stedsnavnregister), eller geografiske koordinater (EU89) for området datasettet gjelder for (punkt eller geografisk grenseramme jf ISO 19115)

Kardinalitet

0..n

Status

Valgfri

Datasett: tidsrom

URI

dct:temporal

Range

dct:PeriodOfTime

Beskrivelse

Definerer starten og slutten på perioden med årstall-måned-dag, eventuelt klokkeslett (se ISO 8601)

Kardinalitet

0..n

Status

Valgfri

Datasett: type

URI

dct:type

Range

skos:Concept

Beskrivelse

Referanse til et begrep som identifiserer datasettets type. Noe kontrollert vokabular har ikke blitt etablert.

Kardinalitet

0..1

Status

Valgfri

Datasett: endringsdato

URI

dct:modified

Range

rdfs:Literal typed as xsd:date or xsd:dateTime

Beskrivelse

Dato for siste oppdatering av datasettet

Kardinalitet

0..1

Status

Valgfri

Datasett: versjon

URI

owl:versionInfo

Range

rdfs:Literal

Beskrivelse

Et versjonsnummer eller annen versjonsbetegnelse for datasettet

Kardinalitet

0..1

Status

Valgfri

Datasett: versjonsnote

URI

adms:versionNotes

Range

rdfs:Literal

Beskrivelse

Egenskap som beskriver forskjellene mellom denne og en tidligere versjon av datasettet. Kan gjentas for parallelle språkversjoner av versjonsnotater.

Kardinalitet

0..n

Status

Valgfri

Datasett: skaper

URI

dct:creator

Range

rdfs:Resource

Beskrivelse

Referanse til produsent av datasettet

Kardinalitet

0..n

Status

Valgfri

Kommentar

Norsk utvidelse

Datasett: refererer til

URI

dct:references

Range

dcat:Dataset

Beskrivelse

Referanse til andre datasett som det kan være nyttig for brukere å være oppmerksom på

Kardinalitet

0..n

Status

Valgfri

Kommentar

Norsk utvidelse

Datasett: er referert av

URI

dct:isReferencedBy

Range

dcat:Dataset

Beskrivelse

Referanse til datasett som refererer til dette datasettet

Kardinalitet

0..n

Status

Valgfri

Kommentar

Norsk utvidelse

Datasett: er del av

URI

dct:isPartOf

Range

dcat:Dataset

Beskrivelse

Referanse til datasett som dette datasettet er en del av

Kardinalitet

0..n

Status

Valgfri

Kommentar

Norsk utvidelse

Datasett: har del

URI

dct:hasPart

Range

dcat:Dataset

Beskrivelse

Referanse til datasett som er en del av dette datasettet

Kardinalitet

0..n

Status

Valgfri

Kommentar

Norsk utvidelse

Datasett: krever

URI

dct:requires

Range

dcat:Dataset

Beskrivelse

Referanse til dataset som er nødvendig for å bruke dette datasettet riktig. Eksempel: et datasett kan bruke kodeverdier som er definert i et annet datasett.

Kardinalitet

0..n

Status

Valgfri

Kommentar

Norsk utvidelse

Datasett: er påkrevd av

URI

dct:isRequiredBy

Range

dcat:Dataset

Beskrivelse

Relasjon til datasett som dette datasettet er nødvendig for

Kardinalitet

0..n

Status

Valgfri

Kommentar

Norsk utvidelse

Datasett: erstatter

URI

dct:replaces

Range

dcat:Dataset

Beskrivelse

Referanse til datasett dette datasettet er ment å erstatte

Kardinalitet

0..n

Status

Valgfri

Kommentar

Norsk utvidelse

Datasett: erstattes av

URI

dct:isReplacedBy

Range

dcat:Dataset

Beskrivelse

Referanse til datasett som er ment å erstatte dette datasettet

Kardinalitet

0..n

Status

Valgfri

Kommentar

Norsk utvidelse

Distribusjon

Egenskaper for klassen Distribusjon (anbefalt)

Distribusjon: tilgangsURL

URI

dcat:accessURL

Range

rdfs:Resource

Beskrivelse

En URL som gir tilgang til en distribusjon av datasettet. Ressursen det pekes til kan gi informasjon om hvordan en kan få tilgang til i datasettet

Kardinalitet

1..n

Status

Obligatorisk

Distribusjon: beskrivelse

URI

dct:description

Range

rdfs:Literal

Beskrivelse

Fritekstbeskrivelse av distribusjonen. Kan repeteres for parallelle språkversjoner

Kardinalitet

0..n

Status

Anbefalt

Distribusjon: format

URI

dct:format

Range

dct:MediaTypeOrExtent

Beskrivelse

Opplysing om til distribusjonens filformat. Kan gjentas for API-er og sluttbrukerapplikasjoner som leverer data i flere formater.

Kardinalitet

1..n

Status

Obligatorisk

Kommentar

Norsk utvidelse - Denne egenskapen skal brukes istedetfor [distribusjon-mediatype]

Distribusjon: lisens

URI

dct:license

Range

dct:LicenseDocument

Beskrivelse

Referanse til lisensen distribusjonen er gjort tilgjengelig under. Bør oppgis som URI, feks http://data.norge.no/nlod/no/1.0

Kardinalitet

0..1

Status

Anbefalt

Distribusjon: filstørrelse

URI

dcat:byteSize

Range

rdfs:Literal typed as xsd:decimal

Beskrivelse

Distribusjonens størrelse oppgitt i bytes

Kardinalitet

0..1

Status

Valgfri

Distribusjon: sjekksum

URI

spdx:checksum

Range

spdx:Checksum

Beskrivelse

Referanse til sjekksuminformasjon (en mekanisme for å verifisere at innhold i en distribusjon ikke har endret seg)

Kardinalitet

0..1

Status

Valgfri

Distribusjon: dokumentasjon

URI

foaf:page

Range

foaf:Document

Beskrivelse

Referanse til en side eller et dokument som beskriver distribusjonen

Kardinalitet

0..n

Status

Valgfri

Distribusjon: nedlastningslenke

URI

dcat:downloadURL

Range

rdfs:Resource

Beskrivelse

Direktelenke (URL) til en nedlastbar fil i et gitt format

Kardinalitet

0..n

Status

Valgfri

Distribusjon: språk

URI

dct:language

Range

dct:LinguisticSystem

Beskrivelse

Referanse til språk som er brukt i distribusjonen

Kardinalitet

0..n

Status

Valgfri

Distribusjon: samsvarer med

URI

dct:conformsTo

Range

dct:Standard

Beskrivelse

Referanse til et etablert skjema som distribusjonen er i samsvar med

Kardinalitet

0..n

Status

Valgfri

Distribusjon: utgivelsesdato

URI

dct:issued

Range

rdfs:Literal typed as xsd:date or xsd:dateTime

Beskrivelse

Dato for formell utgivelse/publisering av distribusjonen

Kardinalitet

0..1

Status

Valgfri

Distribusjon: rettigheter

URI

dct:rights

Range

dct:RightsStatement

Beskrivelse

Viser til en uttalelse som angir rettigheter knyttet til distribusjonen.

Kardinalitet

0..1

Status

Valgfri

Distribusjon: status

URI

adms:status

Range

skos:Concept

Beskrivelse

Distribusjonens modenhet (fullført, under utvikling, utgått, trekt tilbake)

Kardinalitet

0..1

Status

Valgfri

Distribusjon: tittel

URI

dct:title

Range

rdfs:Literal

Beskrivelse

Navn på distribusjonen

Kardinalitet

0..n

Status

Valgfri

Distribusjon: endringsdato

URI

dct:modified

Range

rdfs:Literal typed as xsd:date or xsd:dateTime

Beskrivelse

Dato for siste endring av distribusjonen

Kardinalitet

0..1

Status

Valgfri

Enhet

Det anbefales at URI til Enhet (foaf:Agent) er identisk med den URI som Enhetsregisteret (Brønnøysundregistrene) har på enheten/virksomheten hvis den finnes i registeret.

Egenskaper for klassen Enhet (obligatorisk).

Enhet: navn

URI

foaf:name

Range

rdfs:Literal

Beskrivelse

Navn på enheten. Denne egenskapen kan gjentas for ulike versjoner av navnet (som navnet på forskjellige språk)

Kardinalitet

1..n

Status

Obligatorisk

Enhet: utgivertype

URI

dct:type

Range

skos:Concept

Beskrivelse

Refererer til type for enheten som gjør katalogen eller datasett tilgjengelig

Kardinalitet

0..1

Status

Anbefalt

Enhet: organisasjonsidentifikator

URI

dct:identifier

Range

rdfs:Literal

Beskrivelse

Egenskap som angir organisasjonens identifikasjonsnummer, for eksempel i henhold til Enhetsregisterets organisasjonsnummer

Kardinalitet

0..1

Status

Anbefalt

Kommentar

Norsk utvidelse

Kategoriskjema

Egenskaper for klassen Kategoriskjema (obligatorisk)

Kategoriskjema: tittel

URI

dct:title

Range

rdfs:Literal

Beskrivelse

Navn på kategori-skjemaet. Kan gjentas for forskjellige versjoner av navnet

Kardinalitet

1..n

Status

Obligatorisk

Kategori

Egenskaper for klassen Kategori (obligatorisk)

Kategori: foretrukket tittel

URI

skos:prefLabel

Range

rdfs:Literal

Beskrivelse

Foretrukket tittel for kategorien. Kan gjentas for parallelle språkversjoner av etiketten.

Kardinalitet

1..n

Status

Obligatorisk

Lisensdokument

Egenskaper for klassen Lisensdokument (anbefalt)

Lisensdokument: lisenstype

URI

dct:type

Range

rdfs:Class

Beskrivelse

Refererer til en type lisens, f.eks "åpen lisens" eller "royalties kreves".

Kardinalitet

0..1

Status

Anbefalt

Sjekksum

Egenskaper for klassen Sjekksum (valgfri)

Sjekksum: algoritme

URI

spdx:algorithm

Range

spdx:checksumAlgorithm_sha1

Beskrivelse

Identifiserer algoritmen som er brukt til å produsere sjekksum. For øyeblikket er SHA-1 den eneste algoritmen som er støttet. Det er forventet støtte for andre algoritmer på et senere tidspunkt.

Kardinalitet

1..1

Status

Obligatorisk

Sjekksum: sjekksumverdi

URI

spdx:checksumValue

Range

rdfs:Literal typed as xsd:hexBinary

Beskrivelse

Denne egenskapen brukes til å oppgi en heksadesimal-kodet verdi med små bokstaver, produsert ved hjelp av en spesifikk algoritme.

Kardinalitet

1..1

Status

Obligatorisk

Tidsrom

Egenskaper for klassen Tidsrom (valgfri)

Tidsrom: startdato/tid

URI

schema:startDate

Range

rdfs:Literal typed as xsd:date or xsd:dateTime

Beskrivelse

Definerer starten på tidsrommet

Kardinalitet

0..1

Status

Valgfri

Tidsrom: sluttdato/tid

Range

rdfs:Literal typed as xsd:date or xsd:dateTime

URI

schema:endDate

Beskrivelse

Definerer slutten på tidsrommet

Kardinalitet

0..1

Status

Valgfri

Kommentar

Vær oppmerksom på at mens begge egenskapene er valgfrie, må en av de to være til stede.

Starten av tidsrommet skal forstås som starten på dato, time, minutt etc. gitt (for eksempel starter ved midnatt på begynnelsen av dagen hvis verdien er en dato); slutten av tidsrommet skal forstås som i slutten av dato, time, minutt etc. gitt (for eksempel slutter ved midnatt på slutten av dagen hvis verdien er en dato)

Krav til kontrollerte vokabular

Følgende kriterier er gjeldende for vokabular som skal anbefales for bruk i denne standarden:

De bør:

  • være publisert under en åpen lisens.

  • brukes og / eller bli vedlikeholdt av en institusjon i Norge eller EU, av et anerkjent standardiseringsorganisasjon eller en annen pålitelig organisasjon.

  • være skikkelig dokumentert.

  • ha etiketter på flere språk.

  • inneholde et relativt lite antall begreper (f.eks 10-25) som er generelle nok til at et bredt spekter av ressurser kan klassifiseres.

  • ha begreper som er identifisert av URIer der hver URI peker til dokumentasjon av begrepene.

  • ha en varighets- og versjonspolicy.

Disse kriteriene er ikke tenkt å definere et sett med krav til kontrollerte vokabular generelt; de er kun ment brukt for utvelgelse av de kontrollerte vokabularene som er anbefalt for denne standarden

Kontrollerte vokabular som skal brukes

Under følger en oversikt over kontrollerte vokabular som brukes for egenskapene i listen. Etablering av disse kontrollerte vokabularene som obligatoriske, sikrer et minimum av samhandlingsevne

Dataset Theme Vocabulary

URI

dcat:theme

Brukt i (klasse)

Datasett, Katalog

URI for vokabularet

http://publications.europa.eu/resource/authority/datatheme

Beskrivelse

Verdiene som skal brukes for Datasett: tema er URIene for begrepene i selve vokabularene som brukes. Verdiene som skal brukes for Katalog: temaer er URIen til selve vokabularet. Det vil si begrepsskjemaet (concept scheme), ikke URIene for begrepene i vokabularet.

Dublin Core Collection Description Frequency Vocabulary

URI

dct:accrualPeriodicity

Brukt i (klasse)

Datasett

URI for vokabularet

http://purl.org/cld/freq/

IANA Media Types

URI

dct:format

Brukt i (klasse)

Distribusjon

URI for vokabularet

http://www.iana.org/assignments/media-types/media-types.xhtml

Beskrivelse

Dersom aktuelt filformat ikke finnes hos IANA, angis filformatet etter samme oppbygging

DCAT-APs krav om å bruke MDR File Type Named Authority List er endret til IANA Media Types for klassen format.

MDR Corporate bodies Named Authority List

URI

dct:publisher

Brukt i (klasse)

Katalog, Datasett

URI for vokabularet

http://publications.europa.eu/mdr/authority/corporate-body/

Beskrivelse

Skal brukes for europeiske institusjoner og et lite sett med internasjonale organisasjoner. Ved andre typer organisasjoner, bør URIer eller organisasjonsnummer fra Enhetsregisteret brukes.

Geonames

URI

dct:spatial

Brukt i (klasse)

Katalog, Datasett

URI for vokabularet

http://sws.geonames.org/

Beskrivelse

En referanse til administrativ enhet (nivå 1 eller 2) i geonames, for eksempel http://sws.geonames.org/6453366/

ADMS change type vocabulary

URI

adms:status

Brukt i (klasse)

Katalogpost

URI for vokabularet

http://purl.org/adms/changetype/

Beskrivelse

:created, :updated, :deleted

ADMS status vocabulary

URI

adms:status

Brukt i (klasse)

Distribusjon

URI for vokabularet

http://purl.org/adms/status/

Beskrivelse

Listen over begrep i ADMS status-vokabularet er inkludert i ADMS-spesifikasjonen

ADMS publisher type vocabulary

URI

dct:type

Brukt i (klasse)

Enhet

URI for vokabularet

http://purl.org/adms/publishertype/

Beskrivelse

Listen over begrep i ADMS-vokabularet for utgivertype er inkludert i ADMS-spesifikasjonen

ADMS licence type vocabulary

URI

dct:type

Brukt i (klasse)

Lisensdokument

URI for vokabularet

http://purl.org/adms/licencetype/

Beskrivelse

Listen over begrep i ADMS-vokabularet for lisenstype er inkludert i ADMS spesifikasjonen

I tillegg til de foreslåtte felles-vokabularene ovenfor, oppfordres virksomheter til å publisere og bruke ytterligere regionale eller domenespesifikke vokabular som er tilgjengelig på internett. Selv om de ikke alltid blir gjenkjent og brukt av generelle implementeringer av standarden, kan de bidra til å øke samhandlingsevne på tvers av applikasjoner innenfor samme domene. Eksempler her er komplett sett med begreper i LOS, EuroVoc, CERIFs standardvokabular, Deweys desimalklassifikasjon og en rekke andre vokabular.