digitaliseringsdirektoratet
Dette dokumentet kan også lastes ned som PDF.
Innmelding av feil og mangler:
Dersom du finner feil eller mangler i dokumentet, ber vi om at dette meldes inn på Github Issues. Dersom du ikke allerede har bruker på Github kan du opprette bruker gratis.

Status: Gjeldende
Versjon: 2.0
Publisert: 2019-06-30
Oppdatert: 2021-07-09
Gjeldende versjon: https://data.norge.no/guide/veileder-beskrivelse-av-datasett/
Forrige versjon: https://data.norge.no/guide/veileder-beskrivelse-av-datasett/v1
Redaktørens utkast: https://informasjonsforvaltning.github.io/veileder-beskrivelse-av-datasett/

Om denne veilederen

Hensikt og avgrensing

Denne veilederen skal bidra til bedre beskrivelser av datasett, datatjenester og datakataloger. For offentlige virksomheter kan dette være en del av prosessene for å skape orden i eget hus, oppnå mer gjenbruk av data mellom offentlige virksomheter og å gjøre mer åpne offentlige data tilgjengelig for næringsliv og sivilsamfunn. Se Veileder for orden i eget hus for hvordan din virksomhet skaper orden i eget hus, bl.a. hvordan kartlegge hvilke data som skal beskrives.

Denne veilederen tar utgangspunktet i at din virksomhet har kartlagt hvilke data som skal beskrives. Veilederen skal gi en hjelp i å beskrive datasett og datatjenester i henhold til Standard for beskrivelse av datasett, datatjenester og datakataloger (DCAT-AP-NO) v.2, slik at beskrivelsene lettere kan forstås og brukes av andre.

Det er ikke et mål for denne veilederen å beskrive alle klasser og egenskaper i DCAT-AP-NO. Gi oss beskjed hvis det er ting som du savner veiledning av, fortrinnsvis meldes inn på Github Issues og med konkrete eksempler på data.

Denne veilederen er ikke en teknisk og normativ spesifikasjon. For normative beskrivelser av alle klasser og egenskaper i DCAT-AP-NO, se DCAT-AP-NO og valideringsreglene (shacl). Ikke alle eksempler i denne veilederen er komplette, heller ikke med tanke på obligatoriske egenskaper.

Denne veilederen er ikke en direkte veiledning for bruk av registreringsverktøyet i Fellesdatakatalogen.

Målgruppe

Målgruppen for denne veilederen er primært deg som skal beskrive datasett, datatjenester og datakataloger i din virksomhet i henhold til DCAT-AP-NO v.2.

Sekundært kan også veilederen brukes av deg som skal utvikle/tilpasse verktøystøtte i virksomhetene for beskrivelser av datasett/datatjenester/datakataloger og/eller eksponering av slike beskrivelser i henhold til DCAT-AP-NO v.2.

Struktur

Denne veilederen forklarer hvordan du beskriver følgende i henhold til DCAT-AP-NO v.2:

Veilederen inneholder også veiledning ang. noen utvalgte temaer som går på tvers av ovennevnte:

Tabell 1. Teknisk veiledning - Navnerom som er brukt i denne veilederen

Prefiks

Navnerom

Forklaring/navn

adms

http://www.w3.org/ns/adms#

Asset Description Metadata Schema

cpsv

http://purl.org/vocab/cpsv#

Core Public Service Vocabulary

cpsvno

https://data.norge.no/vocabulary/cpsvno#

Norsk applikasjonsprofil av CPSV (CPSV-AP-NO)

dcat

http://www.w3.org/ns/dcat#

Data Catalog Vocabulary

dct

http://purl.org/dc/terms/

DCMI Metadata Terms

dqv

http://www.w3.org/ns/dqv#

Data Quality Vocabulary

dqvno

https://data.norge.no/vocabulary/dqvno#

Norsk applikasjonsprofil av DQV (Data Quality Vocabulary)

eli

http://data.europa.eu/eli/ontology#

European Legislation Identifier

foaf

http://xmlns.com/foaf/0.1/

FOAF Vocabulary

locn

http://www.w3.org/ns/locn#

Core Location Vocabulary

modelldcatno

https://data.norge.no/vocabulary/modelldcatno#

Spesifikasjon for beskrivelse av informasjonsmodeller (ModellDCAT-AP-NO)

oa

https://www.w3.org/TR/annotation-vocab/#

Web Annotation Ontology

odrl

http://www.w3.org/ns/odrl/2/

The Open Digital Rights Language (ODRL)

owl

http://www.w3.org/2002/07/owl#

OWL Web Ontology Language

prov

http://www.w3.org/ns/prov#

PROV-O: The PROV Ontology

provno

https://data.norge.no/vocabulary/provno#

Norsk applikasjonsprofil av PROV-O

rdfs

http://www.w3.org/2000/01/rdf-schema#

RDF Vocabulary Description Language 1.0: RDF Schema

skos

http://www.w3.org/2004/02/skos/core#

SKOS Simple Knowledge Organization System

time

https://www.w3.org/2006/time

Time Ontology in OWL

vcard

http://www.w3.org/2006/vcard/ns#

vCard Ontology

xkos

http://rdf-vocabulary.ddialliance.org/xkos#

An SKOS extension for representing statistical classifications

xsd

http://www.w3.org/2001/XMLSchema#

XML Schema Part 2: Datatypes Second Edition

Beskrivelse av datasett

Se Veileder for orden i eget hus for hvordan din virksomhet kartlegger hvilke datasett som skal beskrives.

Hovedhensikten med å beskrive et datasett er at andre (internt eller eksternt) lettere skal kunne forstå hva slags datasett du har, for bl.a. å kunne vurdere om de kan gjenbruke/viderebruke dette datasettet fra deg.

For at andre skal kunne forstå dine beskrivelser, er det visse spilleregler for hvordan et datasett skal/bør/kan beskrives.

Dette kapittelet forklarer hvordan et datasett beskrives i henhold til kravene i forvaltningsstandarden DCAT-AP-NO v.2, dog uten at du må kunne DCAT-AP-NO.

For deg som skal utvikle/tilpasse verktøystøtte for datasettbeskrivelse i henhold til DCAT-AP-NO, inneholder veilederen også en teknisk veiledning bakerst i hvert avsnitt. NB! Bortsett fra det første eksemplet, er ikke alle eksempler i RDF Turtle komplette og de kan mangle bl.a. verdier for obligatoriske egenskaper.

Eksempel på en datasettbeskrivelse

Under er et eksempel på en datasettbeskrivelse, med dummydata, hvor uthevede egenskaper er obligatoriske:

Eksempel på en datasettbeskrivelse med dummydata, hvor uthevede egenskaper er obligatoriske:

Tittel: Eksempeldatasett
Utgiver: Direktoratet for eksempler
Beskrivelse: Datasett med testdata. Formålet med dette datasettet er å illustrere hvordan et datasett skal/bør/kan beskrives iht. DCAT-AP-NO.
Tema: Forvaltning og offentlig sektor
Begrep: testdata
Dekningsområde: Norge
Oppdateringsfrekvens: Daglig
Tilgangsnivå: Offentlig
Distribusjon: https://example.org/eksempeldata.csv (NB! dummy-URL som ikke virker)
Kontaktpunkt: Direktoratet for eksempler, data@direks.eks (NB! dummy-e-postadresse som ikke virker)
Språk: Norsk bokmål

Teknisk veiledning

Eksemplet ovenfor i RDF Turtle:

@prefix dcat: <http://www.w3.org/ns/dcat#> .
@prefix dct: <http://purl.org/dc/terms/> .
@prefix vcard: <http://www.w3.org/2006/vcard/ns#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
@prefix : <https://example.org/> .

<https://example.org/eksempeldata> a dcat:Dataset ;
  ### obligatoriske egenskaper:
    dct:identifier "https://example.org/eksempeldata"^^xsd:anyURI ; # identifikator
    dct:title "Eksempeldatasett"@nb ; # tittel
    dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/999999999> ; # utgiver, med dummy-org.nr.
    dct:description "Datasett med testdata"@nb ;
    dcat:theme <http://publications.europa.eu/resource/authority/data-theme/GOVE> ; # tema, Forvaltning og offentlig sektor
  ### anbefalte egenskaper:
    dct:subject <http://publications.europa.eu/resource/authority/dataset-type/TEST_DATA> ; # begrep, 'testdata'
    dct:spatial <http://publications.europa.eu/resource/authority/country/NOR> ; # dekningsområde, Norge
    dct:accrualPeriodicity <http://publications.europa.eu/resource/authority/frequency/DAILY> ; # frekvens, daglig oppdatering
    dct:accessRights <http://publications.europa.eu/resource/authority/access-right/PUBLIC> ; # tilgangsnivå, offentlig
  ### valgfrie egenskaper:
    dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; # språk, norsk bokmål
    dcat:contactPoint [ a vcard:Organization ; # kontaktpunkt, med dummy data
       vcard:hasEmail <mailto:eks@direks.eks> ; # e-post
       vcard:organization-unit "Direktoratet for eksempler" ; # navn
       ] ;
  dcat:distribution [ a dcat:Distribution ; # distribusjon, med dummy data
    ### obligatoriske egenskaper:
      dcat:accessURL <https://example.org/eksempeldata.csv> ; # tilgangsURL, med dummy URL
    ### anbefalte egenskaper:
      dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ; # lisens
    ] ;
  .

Obligatoriske egenskaper i en datasettbeskrivelse

Som et minimum skal følgende tas med i en datasettbeskrivelse:

  • Datasett - beskrivelse: beskrivelse av datasettet.

  • Datasett - identifikator: identifikator til datasettet.

  • Datasett - tema: tema som datasettet kan sorteres under.

  • Datasett - tittel: navnet på datasettet.

  • Datasett - utgiver: aktør (organisasjon) ansvarlig for å gjøre datasettet tilgjengelig.

Datasett - beskrivelse

For at andre skal kunne vite hva slags datasett du har, skal du oppgi en kort og presis beskrivelse av datasettet.

  • Beskrivelsen skal være kortfattet slik at lister over datasett forståes ved å lese de første linjene.

  • Hensikten med datasettet bør komme fram (f.eks. “Løsøreregisteret inneholder tinglyste flyttbare eiendeler”).

  • Beskriv hva datasettet inneholder. Hvilke opplysninger som utgjør kjernen i datasettet bør angis.

  • Feltinnhold skal ikke listes her i beskrivelsen, men i Datasett - emneord eller Datasett - begrep.

  • Beskrivelsen er ikke en gjentakelse av Datasett - tittel.

  • Bruk folkelige ord (f.eks. “Løsøre” forklares som “flyttbare eiendeler (Løsøre)”, ev. bare folkelige uttrykk mens faguttrykket tas med som Datasett - emneord slik at det gir treff i søk).

  • Beskriv avgrensninger, hva datasettet ikke inneholder, dersom dette kan misforstås ut fra tittelen.

  • Begrens bruk av lenker og markup (formatering) i teksten. Skal man angi språk må teksten formelt sett være fri for lenker og formatering (HTML).

Eksempler
  • “Løsøreregisteret inneholder løsøre med unntak av skip og luftfartøy” Et lite folkelig ord (løsøre) er brukt. Avgrensningene her er greie.

  • “Løsøreregisteret inneholder tinglyste flyttbare eiendeler som biler og båter” Hva som inngår i datasettet er godt beskrevet, men unntakene her er utelatt.

  • “Løsøreregisteret inneholder tinglyste flyttbare eiendeler med unntak av skip og luftfartøy”

Teknisk veiledning

Dette tilsvarer Datasett: beskrivelse (dct:description) i DCAT-AP-NO.

  • Der målform er kjent skal språkkoden "nb" (bokmål) eller "nn" (nynorsk) brukes, "no" (norsk) brukes ellers.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:description "Løsøreregisteret inneholder tinglyste flyttbare eiendeler med unntak av skip og luftfartøy"@nb .

Datasett - identifikator

For å kunne referere til et datasett er det nødvendig å tilordne datasettet en identifikator. Identifikatoren er som regel systemgenerert av verktøyet som brukes til å beskrive et datasett, slik at du som vanlig bruker ikke trenger å oppgi verdien til denne egenskapen manuelt.

Datasett - tema

For å kunne sortere datasettet inn under gitte kategorier er det nødvendig å tilordne "tema" til datasettet.

Eksempler
  • Helse (HEAL fra EU-listen)

  • Helsestasjon (helsestasjon fra LOS)

Teknisk veiledning

Dette tilsvarer Datasett: tema (dcat:theme) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dcat:theme <http://publications.europa.eu/resource/authority/data-theme/HEAL> , # helse
    <https://psi.norge.no/los/ord/helsestasjon> . # helsestasjon

Datasett - tittel

For at andre lett skal kunne se hva datasettet ditt omhandler når datasettet f.eks. er listet opp blant mange andre datasett, er det nødvendig å gi datasettet ditt en tittel.

  • Tittelen skal være kortfattet, kunne stå alene og gi mening.

  • Organisasjonens navn trenger ikke å være med, med mindre det er spesielt relevant for datasettets innholdsmessige utvalg.

  • Tittelen skal gjenspeile avgrensninger dersom datasettet er avgrenset i populasjonen - populasjonen er avgrenset av geografi eller formål, f.eks. “…​ med støtte i Lånekassen”, “…​ i Oslo”, “Folketellingen av 1910”. Der populasjonen ikke er avgrenset angis IKKE dette (f.eks. valgkrets)

  • Forkortelser skal skrives helt ut (DTM10 erstattes av “Digital Terrengmodell 10m oppløsning (DTM10)” . Bruk eventuelt Datasett - emneord til forkortelser. Målgruppen er personer som ønsker å finne relevante datasett raskt, unngå derfor interne navn eller forkortelser i tittel. I det offentlige opererer man ofte med flere titler eller navn på ting. Et datasett kan ha et offisielt navn, et kortnavn og en forkortelse. For eksempel: Datasettet “Administrative enheter i Norge” har ABAS som forkortelse. Det er sjelden man bruker den fulle tittelen, så for å gjøre et datasett mest mulig søkbart er det behov for at man kan registrere kortnavn, forkortelser og/eller alternative titler.

  • Lov- eller forskriftshjemlede navn bør brukes i tittel (f.eks. Jegerregisteret)

Eksempler
  • “Bomstasjoner i Norge”

  • “Statens vegvesens oversikt over Bomstasjoner i Norge”

  • “Digital Terreng Modell 10m oppløsning (DTM10)”

  • “DTM10”

Teknisk veiledning

Dette tilsvarer Datasett: tittel (dct:title) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:title "Bomstasjoner i Norge"@nb .

Datasett - utgiver

For at andre lett skal kunne se hvem som er ansvarlig for at datasettet ditt er tilgjengelig (ikke nødvendigvis samme som den som faktisk gjør datasettet tilgjengelig), er det nødvendig å oppgi utgiver.

  • Skal peke på en virksomhet (juridisk person, organisasjonsledd, underenhet).

  • Utgiveren av datasettet forvalter sammensetning av dataene, altså datasettet, og ikke nødvendigvis selve dataene.

Eksempler
  • Arbeids- og velferdsetaten

Teknisk veiledning

Dette tilsvarer Datasett: utgiver (dct:publisher) i DCAT-AP-NO.

Inntil https://data.brreg.no tilbyr RDF-baserte metadata basert på organisasjonsnummeret (orgnummer), skal følgende mønster benyttes: https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/{orgnummer}.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/889640782> . #NAV

Anbefalte egenskaper i en datasettbeskrivelse

Følgende opplysninger bør du ta med i en datasettbeskrivelse hvis de finnes:

  • Datasett - begrep: begrep som er viktig for å forstå og tolke datasettet.

  • Datasett - ble generert ved: aktivitet ved hvilken datasettet ble generert.

  • Datasett - datasettdistribusjon: tilgjengelig distribusjon av datasettet.

  • Datasett - dekningsområde: geografisk område dekket av datasettet.

  • Datasett - emneord: emneord (søkeord) dekket av datasettet.

  • Datasett - følger: regelverk som datasettet følger.

  • Datasett - kontaktpunkt: kontaktpunkt ved spørsmål om datasettet.

  • Datasett - tidsrom: tidsrom dekket av datasettet.

  • Datasett - tilgangsnivå: i hvilken grad datasettet kan bli gjort tilgjengelig.

Datasett - begrep

For at andre lett skal kunne forstå typer innhold i datasettet ditt, skal du knyttet datasettet til relevante begrepsdefinisjoner hvis de finnes.

  • Innholdstyper i datasettet beskrives med referanse til begreper i begrepskatalog.

  • Dersom det ikke kan benyttes en begrepskatalog brukes Datasett - emneord.

Eksempler
  • Løsøre, Pant, Tinglysing

Ytterligere anbefalinger

Et datasett bør knyttes til de aktuelle og sentrale begrepene i en begrepskatalog. Ved å henvise til gjennomarbeidede definisjoner som forvaltes av din virksomhet eller andre, sikrer vi at det er tydelig hvordan et begrep brukt i datasettet skal forstås og at denne forståelsen til en hver tid er riktig og oppdatert. Vi ønsker at alle datasettene skal ha lenker til de aktuelle begrepene i virksomhetens katalog, slik at det er tydelig definert hva begrepene innebærer.

Teknisk veiledning

Dette tilsvarer Datasett: begrep (dct:subject) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:subject <http://brreg.no/begrepskatalog/begep/løsøre>,
              <http://brreg.no/begrepskatalog/begep/pant>,
              <http://brreg.no/begrepskatalog/begep/tingslysning> .

Datasett - ble generert ved

Hvilken type aktivitet dine data ble generert ved, kan ha betydning for dem som skal vurdere gjenbruk/viderebruk av dine data. Du skal derfor oppgi dette hvis det er mulig.

Det anbefales å bruke en av følgende verdier:

  • ved vedtak: datasettet ble generert som et resultat / ifm. et vedtak. Eksempel: skatteoppgjør.

  • ved innhenting fra tredjepart: datasettet ble hentet inn fra en tredjepart. Eksempel: preutfylt skattemelding.

  • ved innhenting fra brukeren: datasettet ble generert på grunnlag av data fra brukeren. Eksempel: innlevert skattemelding.

Eksempler:
  • ved vedtak

Teknisk veiledning

Dette tilsvarer Datasett: ble generert ved (prov:wasGeneratedBy) i DCAT-AP-NO.

Følgende predefinerte instanser av prov:Activity skal brukes:

  • ved vedtak: provno:administrativeDecision

  • ved innhenting fra tredjepart: provno:collectingFromThirdParty

  • ved innhenting fra brukeren: provno:collectingFromUser

Eksempel i RDF Turtle:

@prefix provno: <https://data.norge.no/vocabulary/provno#> .

<etDatasett> a dcat:Dataset ;
   prov:wasGeneratedBy provno:administrativeDecision . # vedtak

Datasett - datasettdistribusjon

Hvis datasettet ditt er gjort tilgjengelig skal du beskrive hvor det faktiske datasettet finnes (f.eks. hvor datafilen kan lastes ned), slik at andre skal kunne få tak i datasettet ditt.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
    dcat:distribution <enDistribusjon> . # refererer til en beskrivelse av en distribusjon

Datasett - dekningsområde

Hvis datasettet ditt kun har innhold fra visse geografiske områder, skal du oppgi dette. Datasettet “Observert hekking av grågås i Oppdal” har f.eks. kommune Oppdal som sitt geografiske dekningsområde.

Teknisk veiledning

Dette tilsvarer Datasett: dekningsområde (dct:spatial) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
   dct:spatial <http://publications.europa.eu/resource/authority/country/NOR> , # Norge
      <https://data.geonorge.no/administrativeEnheter/kommune/id/172879> ; # Oppdal
   .

Datasett - emneord

Ord og uttrykk som hjelper brukeren til å finne datasettet og som ikke kan knyttes til publiserte begrepsdefinisjoner, inkluderes som emneord.

  • Angi synonymer til hjelp i søk

  • Angi sentralt innhold i datasettet som ikke finnes begrepsdefinisjoner for ennå

Eksempler
  • uførepensjon, uførepensjonister, uførereform

Teknisk veiledning

Dette tilsvarer Datasett: emneord (dcat:keyword) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dcat:keyword "uførepensjon"@nb, "uførepensjonister"@nb, "uførereformen"@nb .

Datasett - følger

Hvis (oppretting og/eller forvaltning av) datasettet ditt følger gitte regelverk, skal det opplyses om.

  • Angi referanse til regelverk som datasettet følger, og derfra referanse til ev. lovhjemmel.

Eksempler
  • Regel for skjerming, med lenke til lovhjemmel.

  • Regel for utlevering, med lenke til lovhjemmel.

  • Behandlingsgrunnlag, med lenke til lovhjemmel.

Teknisk veiledning

Dette tilsvarer Datasett: følger (cpsv:follows) i DCAT-AP-NO.

Det er predefinerte instanser av cpsv:Rule for hhv. skjermingsregel (cpsvno:ruleForNonDisclosure), utleveringsregel (cpsvno:ruleForDisclosure) og behandlingsgrunnlag (cpsvno:ruleForDataProcessing), som bør brukes ved angivelse av de aktuelle typer regelverk.

Eksempel i RDF Turtle:

@prefix cpsvno: <https://data.norge.no/vocabulary/cpsvno#> .

<etDatasett> a dcat:Dataset ;
  cpsv:follows [ a cpsv:Rule ;
        dct:type cpsvno:ruleForNonDisclosure ; # skjermingsregel
        cpsv:implements [ a eli:eli:LegalResource ; # regulativ ressurs
              dct:type <lov> ; # type ressurs (obligatorisk egenskap)
              rdfs:seeAlso "https://lovdata.no/NL/lov/2016-05-27-14/§3-1" ; # referanse
              dct:title "Skatteforvaltningsloven §3-1"@nb ; # tittel
        ] ;
      ] , [ a cpsv:Rule ;
          dct:type cpsvno:ruleForDisclosure ; # utleveringsregel
          cpsv:implements [ a eli:LegalResource ; # regulativ ressurs
                dct:type <lov> ; # type ressurs (obligatorisk egenskap)
                rdfs:seeAlso "https://lovdata.no/NL/lov/2016-05-27-14/§3-3" ; # referanse
                dct:title "Skatteforvaltningsloven §§ 3-3 til 3-9"@nb ; # tittel
          ] ;
        ] , [ a cpsv:Rule ;
            dct:type cpsvno:ruleForDataProcessing ; # behandlingsgrunnlag
            cpsv:implements [ a eli:LegalResource ; # regulativ ressurs
                dct:type <lov> ; # type ressurs (obligatorisk egenskap)
                rdfs:seeAlso "https://lovdata.no/NL/lov/2016-05-27-14/§3-3" ; # referanse
                dct:title "Skatteforvaltningsloven §§ 3-3 til 3-9"@nb ; # tittel
            ] ;
          ] ;
    .

<lov> a skos:Concept , eli:ResourceType ; # ressurstype 'lov'
  skos:prefLabel "lov"@nb ; # anbefalt term
  skos:definition "rettsregler som fastsetter rettigheter og plikter"@nb ; # definisjon
  .
Kommentaren til rdfs:seeAlso i DCAT-AP-NO sier "for referanse til Lovdata bør ELI-URI brukes". I RDF-eksemplet ovenfor er ELI-URI imidlertid ikke brukt. Dette fordi det p.t. ikke er knyttet funksjonalitet til ELI-URI for henvisninger til deler av en lov, f.eks. §3-3. Det vil si at det for øyeblikket er mulig å henvise til deler ved å bruke ELI, f.eks. https://lovdata.no/eli/lov/2016/05/27/14/nor/section/3-3, men oppslaget vil lede til en hel lov og ikke til §3-3.

Datasett - kontaktpunkt

For at andre skal kunne kontakte utgiveren av et datasett, bør kontaktinformasjonen til utgiveren oppgis.

  • Angi kontaktinformasjonen som kan brukes ved henvendelser om et datasett.

  • Vi anbefaler sterkt å bruke organisatoriske enheter og ikke enkeltpersoner som kontaktpunkt.

Eksempler
  • Opplysningsavdelingen, Brønnøysundregistrene

Teknisk veiledning

Dette tilsvarer Datasett: kontaktpunkt (dcat:contactPoint) i DCAT-AP-NO.

Vcard benyttes for å beskrive kontaktpunktet.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
   dcat:contactPoint [ a vcard:Organization ; # kontaktpunkt
      vcard:hasEmail <mailto:OA-fagstillinger@brreg.no> ; # e-post
      vcard:organization-unit  "Opplysningsavdelingen, Brønnøysundregistrene" ; # navn
      ] .

Datasett - tidsrom

Hvis innholdet i et datasett dekker et avgrenset tidsrom, skal dette opplyses om.

  • Angi tidsmessig avgrensning dersom datasett kun har innhold fra visse perioder. For mange datasett knyttet til registerfunksjoner vil tidsrom være direkte koblet mot oppdateringsfrekvens. For andre datasett vil tidsrom være vesentlig i forhold til forståelse av bruk av dataene, f.eks. folketellinger.

  • Dersom det er angitt en periode med årstall, tolkes dette som fra og med 1. januar første år til og med 31. desember siste år.

  • Ved ett årstall på begynnelse, men ikke angitt slutt, tolkes det at datasettet har data også i en ubestemt fremtid og tilsvarende om startdatoen mangler antas det at det er ikke angitt om datasettet har en start.

  • Dersom datasettet er en av flere i en tidsserie anbefales det at det lages et overordnet datasett for tidsserien uten distribusjoner som peker på hvert datasett. Se også under Beskrivelse av tidsserie/datasettserie.

  • Det benyttes tidsstempel for registreringen av første og siste dataelement i datasettet.

  • Det kan angis flere tidsperioder per datasett, men det anbefales at periodene ikke er overlappende.

Eksempler
  • “1901”

Teknisk veiledning

Dette tilsvarer Datasett: tidsrom (dct:temporal) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:temporal  [ a dct:PeriodOfTime ;
    dcat:startDate "1901-01-01"^^xsd:date ;
    dcat:endDate "1901-12-31"^^xsd:date ;
   ] .

Datasett - tilgangsnivå

Uansett om datasettet ditt er gjort tilgjengelig eller ikke, bør du oppgi i hvilken grad datasettet kan bli gjort tilgjengelig for allmennheten, såkalt tilgangsnivå.

  • Angi om datasettet er helt eller delvis skjermet for innsyn, ved å bruke en av verdiene fra EU sitt kontrollerte vokabular Access right: f.eks. "offentlig" (PUBLIC).

  • Skal gjenspeile det mest begrensede feltet/opplysningen i datasettet.

  • Varianter av datasettet kan være offentlig ved at det utelater de felt som gjør at det opprinnelige datasettet er begrenset teller unntatt offentlighet.

  • Ved bruk av verdiene "begrenset offentlighet" og "unntatt offentlighet" er egenskapen Datasett - følger anbefalt.

Eksempler

Enhetsregisteret (hele):

  • begrenset offentlighet

Enhetsregisteret - Juridisk person (hovedenhet):

  • offentlig

Teknisk veiledning

Dette tilsvarer Datasett: tilgangsnivå (dct:accessRights) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dcat:accessRights <http://publications.europa.eu/resource/authority/access-right/PUBLIC> .

Valgfrie egenskaper i en datasettbeskrivelse

I tillegg til obligatoriske (skal brukes) og anbefalte (bør brukes) egenskaper, er det en del egenskaper som er valgfrie (kan brukes) i en datasettbeskrivelse:

  • Datasett - annen identifikator: sekundær identifikator til datasettet.

  • Datasett - dokumentasjon: referanse til side eller dokument som beskriver datasettet ytterligere.

  • Datasett - eksempeldata: referanse til eksempeldata av datasettet.

  • Datasett - endringsdato: dato for siste oppdatering av datasettet.

  • Datasett - er del av: datasett som dette datasettet er en del av.

  • Datasett - er påkrevd av: datasett som er avhengig av dette datasettet.

  • Datasett - er referert av: datasett som refererer til dette datasettet.

  • Datasett - er versjon av: datasett som dette datasettet er en versjon av.

  • Datasett - erstatter: datasett som dette datasettet erstatter.

  • Datasett - erstattes av: datasett som er erstattet av dette datasettet.

  • Datasett - frekvens: oppdateringsfrekvens av innholdet i datasettet.

  • Datasett - har del: datasett som inngår i dette datasettet.

  • Datasett - har kvalitetsnote: tekstlig beskrivelse av kvalitet på datasettet.

  • Datasett - har måleresultat: kvantifiserbar beskrivelse av kvalitet på datasettet.

  • Datasett - har versjon: datasett som er versjon av dette datasettet.

  • Datasett - i samsvar med: standard/spesifikasjon (inkl. informasjonsmodell) som datasettet er i samsvar med.

  • Datasett - kilde: datasett som dette datasettet er avledet fra.

  • Datasett - krever: datasett som dette datasettet er avhengig av.

  • Datasett - kvalifisert kreditering: aktør som har en eller annen form for ansvar for datasettet.

  • Datasett - kvalifisert relasjon: beslektet ressurs (f.eks. en publikasjon)

  • Datasett - landingsside: nettside som gir tilgang til datasettet, tilleggsinfo om datasettet etc.

  • Datasett - opphav: beskrivelse av endring i eierskap og forvaltning av datasettet.

  • Datasett - produsent: aktør som har produsert datasettet.

  • Datasett - refererer til: en annen ressurs som kan være nyttig for brukere av datasettet å være oppmerksom på.

  • Datasett - relatert ressurs: annen beslektet ressurs.

  • Datasett - romlig oppløsning: minst romlig oppløsning for datasettet.

  • Datasett - språk: språk datasettet er på.

  • Datasett - tidsoppløsning: miste oppløsning i tidsperiode i datasettet.

  • Datasett - type: datasettets type.

  • Datasett - utgivelsesdato: dato for den formelle utgivelsen av datasettet.

  • Datasett - versjon: versjonsnummer eller annen versjonsbetegnelse for datasettet.

  • Datasett - versjonsnote: beskrivelse av forskjellene mellom denne og en tidligere versjon av datasettet.

Ikke alle valgfrie egenskaper er beskrevet i etterfølgende avsnitt. Se under Hensikt og avgrensning for hvordan du kan melde inn behov for beskrivelser.

Datasett - dokumentasjon

Utdypende dokumentasjon av datasettet angis ved å peke på en side der den finnes.

Teknisk veiledning

Dette tilsvarer Datasett: dokumentasjon (foaf:page) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  foaf:page <https://confluence.brreg.no/display/DBNPUB/Informasjonsmodell+for+Enhetsregisteret+og+Foretaksregisteret> .

Datasett - eksempeldata

Benyttes for å gi eksempeldata for et datasett, og hvordan en faktisk distribusjon ser ut.

  • Dersom datasettet inneholder personopplysninger vil det være nyttig for bruker å se et eksempeldatasett som f.eks. viser en anonymisert rad i datasettet.

Teknisk veiledning

Dette tilsvarer Datasett: eksempeldata (adms:sample) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  adms:sample <distribusjonAvEksempeldata> .

<distribusjonAvEksempeldata> a dcat:Distribution ;
  dcat:accessURL <https://example.org/eksempeldata.csv> .

Datasett - endringsdato

For at andre skal kunne vite når datasettet sist ble oppdatert angis tidspunkt for siste endring.

  • Tidspunktet angir når innholdet i datasettet sist er endret.

Eksempler
  • 01.01.2017

Teknisk veiledning

Dette tilsvarer Datasett: endringsdato (dct:modified) i DCAT-AP-NO.

  • Angis som dato (xsd:date) eller tidspunkt (xsd:dateTime).

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:modified "2017-01-01"^^xsd:date .

Datasett - er del av

Brukes til å angi at det aktuelle datasettet er en delmengde at et annet datasett.

  • Der registre oppdeles i mindre datasett skal relasjonen brukes. F.eks. er datasettet Underenheter er del av datasettet Enhetsregisteret.

  • Den motsatte relasjonen Datasett - har del brukes til å uttrykke at et datasett består av andre datasett.

Teknisk veiledning

Dette tilsvarer Datasett: er del av (dct:isPartOf) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<underenheter> a dcat:Dataset ;
  dct:isPartOf <enhetsregisteret> .

<enhetsregisteret> a dcat:Dataset .

Datasett - er påkrevd av

Brukes til å referere til annet datasett som det aktuelle datasettet er nødvendig for.

Teknisk veiledning

Dette tilsvarer Datasett: er påkrevd av (dct:isRequiredBy) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<datasettA> a dcat:Dataset ;
  dct:isRequiredBy <datasettB> .

<datasettB> a dcat:Dataset .

Datasett - er versjon av

Brukes til å referere til et annet datasett som det aktuelle datasettet er en versjon av.

  • I prinsippet det samme datasettet, men hvor innholdet er blitt oppdatert f.eks. på bakgrunn av bedret datakvalitet e.l.

Teknisk veiledning

Dette tilsvarer Datasett: er versjon av (dct:isVersionOf) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:isVersionOf <forrigeVersjon> .

<forrigeVersjon> a dcat:Dataset .

Datasett - erstattes av

Brukes til å referere til et datasett som erstatter dette datasettet.

  • F.eks. kan et kodeverk bli erstattet av en nyere utgave.

Teknisk veiledning

Dette tilsvarer Datasett: erstattes av (dct:isReplacedBy) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:isReplacedBy <nyUtgave> .

<nyUtgave> a dcat:Dataset .

Datasett - frekvens

Brukes til å beskrive hvor ofte datasettet blir oppdatert.

  • Beskriv hvor ofte datasettet har nytt innhold. For eksempel oppdateres Enhetsregisteret med nye enheter og sletting av enheter kontinuerlig, mens Inntektsdata fra likningen (Skattemelding) er årlig og Folketelling fra 1910 oppdateres aldri.

  • Begreper (og tilhørende URIer) fra EU sitt kontrollerte vokabular for Frequency skal benyttes.

Eksempler
  • Daglig

Teknisk veiledning

Dette tilsvarer Datasett: frekvens (dct:accrualPeriodicity) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:accruralPeriodicity <http://publications.europa.eu/resource/authority/frequency/DAILY> .

Datasett - i samsvar med

Brukes til å beskrive at et datasett er i henhold til gitt(e) standard(er)/spesifikasjon(er)/informasjonsmodell(er)/o.l.

Se under Sammenheng mellom datasett …​ og informasjonsmodell for knytting av informasjonsmodell til datasett.

Eksempler

Datasettet er i samsvar med "Produktspesifikasjon NVE flomsoner" som innholdsstandard.

Teknisk veiledning

Dette tilsvarer Datasett: i samsvar med (dct:conformsTo) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dcat:conformsTo [ a dct:Standard ;
  skos:prefLabel "Produktspesifikasjon NVE flomsoner 1.0"@nb ;
  rdfs:seeAlso <http://sosi.geonorge.no/Produktspesifikasjoner/Produktspesifikasjon_NVE_Flomsoner_1%200.pdf> ;
  ] .

Datasett - kilde

Brukes til å referere til et datasett som helt eller delvis er en kilde til dette datasettet.

  • Peker til datasettet som helt eller delvis er en kilde for det aktuelle datasettet.

  • Dersom et åpent datasett er basert på et annet hvor personopplysninger er fjernet, kan relasjonen brukes.

  • Et datasett som er avledet fra et annet skal ha en referanse til kilde for det aktuelle datasettet.

  • Dersom det er et utvalg fra et annet datasett bør heller Datasett - er del av brukes.

Teknisk veiledning

Dette tilsvarer Datasett: kilde (dct:source) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dcat:source <kildeDatasett> .

<kildeDatasett> a dcat:Dataset .

Datasett - landingsside

Brukes til å referere til en side med dokumentasjon om datasettet, som kan beskrive datasettets innhold og struktur, og tilgang. Det anbefales at landingsside brukes der man refererer til utfyllende dokumentasjon, og Datasett - datasettdistribusjon benyttes f.eks. når man vil referere til en søkeside.

  • kan referere til datasettets hjemmeside

  • kan referere til en samleside som beskriver innhold og struktur

  • kan referere til en samleside om nedlasting/bruk/søk (tjenestene)

  • det kan refereres til flere sider

Teknisk veiledning

Dette tilsvarer Datasett: landingsside (dcat:landingPage) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dcat:landingpage <https://www.brreg.no/om-oss/samfunnsoppdraget-vart/registera-vare/einingsregisteret/> .

Datasett - produsent

Brukes til å angi produsent(er) av datasettet der dette er en annen enn utgiver (Datasett - utgiver).

  • Brukes unntaksvis der datasettet er satt sammen av data som andre har produsert.

  • Der produsent er en sammensatt gruppe, vil det ikke være mulig å bruke organisasjonsnummer. I så fall kan produsent oppgis som en instans av foaf:Agent.

Eksempler
  • “Samarbeidskommunene A, B og C”

Teknisk veiledning

Dette tilsvarer Datasett: produsent (dct:creator) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:creator <samarbeidskommunene> .

<samarbeidskommunene> a foaf:Agent ;
  foaf:name "Samarbeidskommunene A, B og C" .

Datasett - refererer til

Her oppgir du referanse til andre ressurser som det kan være nyttig for brukere å være oppmerksom på.

Teknisk veiledning

Dette tilsvarer Datasett: refererer til (dct:references) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:references [ a dcat:Resource ;
    dct:title "Register over offentlig støtte"@nb ;
    rdfs:seeAlso <http://brreg.no/catalogs/974760673/datasets/ca04abdd-6327-4833-bd05-7a3dca20e6a5> ] .

Datasett - relatert ressurs

Her kan du angi referanser til andre ressurser (f.eks. andre datasett) som gir supplerende informasjon om innholdet i dette datasettet. Kan f.eks. være å relatere til et annet register.

Teknisk veiledning

Dette tilsvarer Datasett: relatert ressurs (dct:relation) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:relation <relatertDatasett> .

<relatertDatasett> a dcat:Dataset .

Datasett - språk

Her kan du oppgi hvilket språk innholdet til datasettet har.

  • Det er hovedspråket benyttet i datasettets innhold som skal angis.

  • Er datasettet uten språklige tekster angis ikke språk.

  • Inneholder datasett tekster på flere språk, og det ikke er tydelig hva som er hovedspråket, angis ikke språk.

Eksempler
  • Norsk bokmål

Teknisk veiledning

Dette tilsvarer Datasett: språk (dct:language) i DCAT-AP-NO.

  • Språk angis ved å velge fra EUs kontrollerte liste over Language.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:language <http://publications.europa.eu/resource/authority/language/NOB> . # Norsk bokmål

Datasett - type

Her kan du klassifisere datasettet ditt, f.eks. at datasettet er en kodeliste, slik at det blir mulig å gruppere datasettet ditt sammen med andre kodelister i f.eks. en katalog.

Teknisk veiledning

Dette tilsvarer Datasett: type (dct:type) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<ds1> a dcat:Dataset ;
  dct:type <http://publications.europa.eu/resource/authority/dataset-type/CODE_LIST> . # kodeliste

<ds2> a dcat:Dataset ;
  dct:type <http://publications.europa.eu/resource/authority/dataset-type/SYNTHETIC_DATA> . # kunstig data

<ds3> a dcat:Dataset ;
  dct:type <http://publications.europa.eu/resource/authority/dataset-type/TEST_DATA> . # testdata

Datasett - utgivelsesdato

Her kan du oppgi når datasettet er operativt og tilgjengelig.

  • Angi når innholdet i datasettet gjøres tilgjengelig. Dette er ikke alltid samsvarende med når den enkelte distribusjonen er tilgjengelig. Og heller ikke når beskrivelsen om datasettet utgis (katalogpostens utgivelse).

Eksempler
  • 01.01.2017

Teknisk veiledning

Dette tilsvarer Datasett: utgivelsesdato (dct:issued) i DCAT-AP-NO.

  • Angis som xsd:date eller xsd:dateTime.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dct:issued "2017-01-01"^^xsd:date .

Beskrivelse av distribusjon

En distribusjon er en spesifikk representasjon av et datasett i form av en fil som brukeren kan få tilgang til. Det vanligste scenariet er at et datasett uttrykkes i flere formater, f.eks. både i Excel og CSV. Det kan også være slik at du kan få tilgang til et datasett enten gjennom en nattlig dump eller ved oppslag mot et API. I begge disse to scenariene anser vi at det er et datasett med to forskjellige distribusjoner. Distribusjonene tilsvarer de samme dataene (samme informasjon), men i forskjellige formater eller via forskjellige tilgangsmekanismer.

Et datasett kan altså ha flere distribusjoner, men alle distribusjonene skal i prinsippet inneholde samme informasjon. I de fleste tilfeller vil transformasjoner til ulike formater være tapsløse, og dermed fullt ut informasjonsmessig likeverdige. Mindre grad av informasjonstap mellom formater kan oppstå, men dette kan likevel representeres som ulike distribusjoner av samme datasett. I slike tilfeller kan en vurdere å bruke Distribusjon - beskrivelse for å synliggjøre dette.

Datasett som tilbys som filnedlasting kan beskrives utelukkende ved hjelp av egenskapene for distribusjons-klassen. Distribusjoner som tilbys via en datatjeneste skal fra og med versjon 2.0 benytte datatjeneste-klassen for å beskrive tjenesten. Når samme datasett er tilgjengelig både som en fil og via et API, beskrives filen som en distribusjon og API-et som en datatjeneste. Relasjonen mellom distribusjonen og datatjenesten uttrykkes gjennom egenskapen Distribusjon - tilgangstjeneste. Se under Utvalgte temaer for mer informasjon om forholdet mellom datasett, distribusjon og datatjeneste.

Merk at den juridiske vurderingen av hvem som kan få tilgang til datasettet gjøres på datasett-nivå (Datasett - tilgangsnivå), mens bruksavtaler for data er knyttet leveransene av data – altså distribusjoner og datatjenester. En kan tilby det samme datasettet under ulike bruksvilkår ved å opprette flere distribusjoner med ulike lisenser/bruksvilkår. Det er krav om bruk av standardiserte bruksavtaler i form av åpne standardlisenser for åpne data som tilbys fra det offentlige (se under Beskrivelse av åpne data).

Det er datatilbyders ansvar å vurdere om forskjellige representasjoner kan forstås som distribusjoner av samme datasett, eller distribusjoner av forskjellige datasett.

For deg som skal utvikle/tilpasse verktøystøtte i henhold til DCAT-AP-NO, inneholder veilederen også en teknisk veiledning bakerst i hvert avsnitt. NB! Bortsett fra det første eksemplet, er ikke alle eksempler i RDF Turtle komplette og de kan mangle bl.a. verdier for obligatoriske egenskaper.

Eksempel på en beskrivelse av en distribusjon

Under er et eksempel på en beskrivelse av en distribusjon, hvor uthevede egenskaper er obligatoriske:

Eksempel på beskrivelse av en distribusjon hvor uthevede egenskaper er obligatoriske:

TilgangsURL: https://example.org/eksempeldata (NB! dummy-URL som ikke virker)
Beskrivelse: Semikolonseparert nedlastbar CSV-fil uten BOM
Format: CSV
Lisens: CC BY 4.0
Nedlastningslenke: https:/example.org/eksempeldata.csv (NB! dummy-URL som ikke virker)

Teknisk veiledning

Eksemplet ovenfor i RDF Turtle:

@prefix dcat: <http://www.w3.org/ns/dcat#> .
@prefix dct: <http://purl.org/dc/terms/> .
@prefix : <https://example.org/> .

<eksempelDistribusjon> a dcat:Distribution ; # distribusjon
  ### obligatoriske egenskaper
    dcat:accessURL <https://example.org/eksempeldata> ;
  ### anbefalte egenskaper:
    dct:description "Semikolonseparert nedlastbar CSV-fil uten BOM"@nb ;
    dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> ;
    dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ;
  ### valgfrie egenskaper:
    dcat:downloadURL <https://example.org/eksempeldata.csv> ;
  .

Obligatoriske egenskaper i beskrivelse av en distribusjon

Som minimum skal følgende tas med i beskrivelsen av en distribusjon:

  • Distribusjon - tilgangsURL: nettadresse (URL) hvor informasjon om tilgang til distribusjonen gis.

Distribusjon - tilgangsURL

Du skal oppgi nettadresse (URL) som gir tilgang til en distribusjon av datasettet. Kan også peke til en nettside som gir informasjon om hvordan en kan få tilgang til datasettet.

  • skal primært benyttes for å peke til en nettside med informasjon om hvordan man får tilgang til distribusjonen.

  • dersom en direktelenke til en fil er den eneste tilgjengelige URL-en, skal denne benyttes (denne dupliseres da fra Distribusjon: nedlastningslenke).

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dcat:distribution [ a dcat:Distribution ; # distribusjon
    dcat:accessURL < https://example.org/eksempel-1 > ] .

Anbefalte egenskaper i beskrivelse av en distribusjon

Følgende opplysninger bør du ta med i beskrivelsen av en distribusjon:

  • Distribusjon - beskrivelse: kort beskrivelse av distribusjonen.

  • Distribusjon - format: distribusjonens filformat.

  • Distribusjon - lisens: lisensen som distribusjonen er gjort tilgjengelig under.

  • Distribusjon - status: distribusjonens modenhet.

  • Distribusjon - tilgjengelighet: hvor lenge det er planlagt å holde distribusjonen tilgjengelig.

Distribusjon - beskrivelse

For at andre skal kunne vite hva distribusjonen gir, bør du ta med en kort fritekstbeskrivelse av distribusjonen. Denne kan gjentas for flere språk.

  • Legge gjerne vekt på å beskrive det som skiller det ulike distribusjonene fra hverandre, selv om dette overlapper med informasjonen som er oppgitt i dedikerte egenskaper

  • Fritekstbeskrivelser av distribusjoner erstatter ikke behovet for strukturerte metadata (som for eksempel formater og oppdateringsfrekvens).

  • Alle fritekstbeskrivelser bør tilbys på engelsk i tillegg til norsk

Eksempler
  • “Semikolonseparert CSV uten Byte Order Mark (BOM)”

  • “JSON-format via data.brreg.no. Oppdateres kontinuerlig”

Teknisk veiledning

Dette tilsvarer Distribusjon: beskrivelse (dct:description) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dcat:distribution # to distribusjoner
    [ a dcat:Distribution ; # distribusjon 1
      dct:description "Semikolonseparert CSV uten Byte Order Mark (BOM)"@nb, "Semicolon-separated CSV without Byte Order Mark (BOM)."@en ;
    ] ,
    [ a dcat:Distribution ; # distribusjon 2
      dct:description "JSON-format via data.brreg.no. Oppdateres kontinuerlig."@nb , "JSON-format via data.brreg.no. Continuously updated."@en ;
    ] .

Distribusjon - format

Hver distribusjon har format for utveksling som bør oppgis, dvs. en maskinlesbar verdi som entydig identifiserer hvilke(t) format(er) datasettet er gjort tilgjengelig som.

  • Det skal angis filtype (f.eks. CSV, JSON) ved å benytte URI-er fra EUs kontrollerte liste over File type.

  • Primært bør en opprette en distribusjon for hvert filformat. Flere formater kan likevel benyttes ved hjelp av kommaseparerte verdier

  • Merk at det kun er mulig å oppgi en Distribusjon - nedlastningslenke pr. distribusjon. nedlastningslenke kan dermed ikke brukes i kombinasjon med at en oppgir flere filformater for samme distribusjon

Teknisk veiledning

Dette tilsvarer Distribusjon: format (dct:format) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dcat:distribution [ a dcat:Distribution ; # distribusjon
    dcat:accessURL <https://example.org/datasets/001> ;
    dct:description "Nedlastbar fil i CSV-format"@nb ;
    dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> ;
    dcat:downloadURL <https://example.org/datasets/download/001-csv> ] .

Distribusjon - lisens

Lisens er påkrevd for alle åpne offentlige data. Du bør ellers også oppgi lisens hvis datasettet er gjort tilgjengelig under gitt lisens.

  • EUs kontrollerte liste over Licence skal brukes, dersom lisensen som benyttes finnes på listen.

  • For åpne data skal en av disse tre lisensene benyttes:

    • Creative Commons Navngivelse 4.0 (CC BY 4.0): http://publications.europa.eu/resource/authority/licence/CC_BY_4_0

    • Creative Commons CC0 1.0 Universal (CC0): http://publications.europa.eu/resource/authority/licence/CC0

    • Norsk lisens for offentlige data (NLOD): http://publications.europa.eu/resource/authority/licence/NLOD_2_0

  • Creative Commons-lisensene anbefales for distribusjoner (og datatjenester) med forventet internasjonal bruk.

Se Veileder for tilgjengeliggjøring av åpne data for mer informasjon om valg av åpne standardlisenser.

Teknisk veiledning

Dette tilsvarer Distribusjon: lisens (dct:license) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dcat:distribution [ a dcat:Distribution ; # distribusjon
    dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ] .

Distribusjon - status

Distribusjonens modenhet er viktig å vite for å kunne vurdere om/når en skal benytte seg distribusjonen. Den bør derfor oppgis.

  • Asset Description Metadata Schema (ADMS) skal benyttes:

    • Fullført: http://purl.org/adms/status/Completed

    • Utgått: http://purl.org/adms/status/Deprecated

    • Under utvikling: http://purl.org/adms/status/UnderDevelopment

    • Trukket tilbake: http://purl.org/adms/status/Withdrawn

Teknisk veiledning

Dette tilsvarer Distribusjon: status (adms:status) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dcat:distribution [ a dcat:Distribution ; # distribusjon
    adms:status <http://purl.org/adms/status/Completed> ] .

Distribusjon - tilgjengelighet

Det er viktig å vite hvor lenge distribusjonen er planlagt tilgjengelig for å kunne vurdere om en skal benytte seg distribusjonen. Den bør derfor oppgis.

  • EUs kontrollerte liste over Distribution availability skal benyttes:

    • Midlertidig: http://data.europa.eu/r5r/availability/temporary

    • Eksperimentell: http://data.europa.eu/r5r/availability/experimental

    • Tilgjengelig: http://data.europa.eu/r5r/availability/available

    • Stabil: http://data.europa.eu/r5r/availability/stable

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dcat:distribution [ a dcat:Distribution ; # distribusjon
    dcatap:availability <http://data.europa.eu/r5r/availability/stable> ] .

Valgfrie egenskaper i beskrivelse av en distribusjon

I tillegg til obligatoriske (skal brukes) og anbefalte (bør brukes) egenskaper, er det en del egenskaper som er valgfrie (kan brukes) i beskrivelse av en distribusjon:

  • Distribusjon - dokumentasjon: en side eller et dokument som beskriver distribusjonen.

  • Distribusjon - endringsdato: dato for siste endring av distribusjonen.

  • Distribusjon - filstørrelse: distribusjonens størrelse oppgitt i bytes.

  • Distribusjon - i samsvar med: et etablert skjema som distribusjonen er i samsvar med.

  • Distribusjon - komprimeringsformat: komprimeringsformatet for distribusjonen som dataene er i dersom de er i en komprimert form, f.eks. for å redusere størrelsen på den nedlastbare filen.

  • Distribusjon - medietype: medietype av distribusjonen.

  • Distribusjon - nedlastningslenke: direktelenke (URL) til en nedlastbar fil i et gitt format.

  • Distribusjon - pakkeformat: formatet til filen der en eller flere datafiler er gruppert sammen, f.eks. for å gjøre det mulig å laste ned et sett relaterte filer.

  • Distribusjon - policy: policyen som uttrykker rettighetene knyttet til distribusjonen hvis de bruker ODRL-vokabularet.

  • Distribusjon - rettigheter: rettigheter knyttet til distribusjonen.

  • Distribusjon - romlig oppløsning: minste romlig oppløsning for en datasettdistribusjon, målt i meter.

  • Distribusjon - sjekksum: sjekksuminformasjon (en mekanisme for å verifisere at innhold i en distribusjon ikke har endret seg).

  • Distribusjon - språk: språk som er brukt i distribusjonen.

  • Distribusjon - tidsoppløsning: minste tidsrom som kan utledes fra datasett-distribusjonen.

  • Distribusjon - tilgangstjeneste: datatjeneste som gir tilgang til distribusjonen.

  • Distribusjon - tittel: navn på distribusjonen.

  • Distribusjon - utgivelsesdato: dato for formell utgivelse/publisering av distribusjonen.

Ikke alle valgfrie egenskaper er beskrevet i etterfølgende avsnitt. Se under Hensikt og avgrensning for hvordan du kan melde inn behov for beskrivelser.

Distribusjon - dokumentasjon

Du kan bruke denne egenskap til å oppgi referanse til en side eller et dokument som beskriver og dokumenterer innhold og struktur som er spesifikk for distribusjonen.

Teknisk veiledning

Dette tilsvarer Distribusjon: dokumentasjon (foaf:page) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dcat:distribution [ a dcat:Distribution ; # distribusjon
    foaf:page <https://confluence.brreg.no/display/DBNPUB/API> ] .

Distribusjon - endringsdato

Dato/tid sist distribusjonen sist ble endret.

Eksempler
  •   01.01.2017

Teknisk veiledning

Dette tilsvarer Distribusjon: endringsdato (dct:modified) i DCAT-AP-NO.

  • Angis som dato (xsd:date) eller tidspunkt (xsd:dateTime).

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # Datasett
  dcat:distribution [ a dcat:Distribution ; # distribusjon
    dct:modified "2017-01-01"^^xsd:date ] .

Distribusjon - i samsvar med

Benyttes for å angi et etablert skjema som distribusjonen er i samsvar med, for eksempel et XSD-dokument.

Teknisk veiledning

Dette tilsvarer Distribusjon: i samsvar med (dct:conformsTo) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dcat:distribution [ a dcat:Distribution ; # distribusjon
    dct:conformsTo <https://data.norge.no/informationmodels/c23f625f-a654-3462-805e-74408cb5367a> ] .

Distribusjon - medietype

Angivelse av medietypen for distribusjonen slik den er definert i IANAs register over medietyper.

  • Angivelse av Distribusjon: medietype er et valgfritt alternativ til å benytte Distribusjon: format. Kun formater som inngår i IANAs register er lovlige verdier.

  • Vi fraråder å angi format både ved hjelp av Distribusjon - medietype og Distribusjon - format for en og samme distribusjon.

  • Vi fraråder å angi flere medietyper for en og samme distribusjon ettersom du kun kan oppgi én nedlastningslenke pr. distribusjon. Opprett heller nye distribusjoner for hvert format/medietype og oppgi nedlastningslenke for hver distribusjon.

Teknisk veiledning
  • Benytt fullstendige https-identifikatorer, f.eks. https://www.iana.org/assignments/media-types/text/csv, og ikke text/csv.

Distribusjon - nedlastningslenke

Nedlastningslenken er en type tilgangs-url som peker direkte til en fil som lastes ned lokalt.

  • Dersom nedlastningslenken er den eneste tilgjengelige lenken for distribusjonen av datasettet, skal denne dupliseres i det obligatoriske feltet Distribusjon - tilgangsURL.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dcat:distribution [ a dcat:Distribution ; # distribusjon
    dcat:downloadURL < https://data.ssb.no/api/klass/v1//versions/683.csv> ] .

Distribusjon - språk

Teknisk veiledning

Se tilsvarende eksempel under Datasett språk i denne veilederen for hvordan språk angis i RDF Turtle.

Distribusjon - tilgangstjeneste

Angir datatjenesten som gir tilgang til distribusjonen.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dcat:distribution [ a dcat:Distribution ; # distribusjon
    dcat:accessService <https://data.brreg.no/enhetsregisteret/api> ] . # datatjeneste/API

Distribusjon - tittel

<ikke beskrevet, tilsvarer Distribusjon: tittel (dct:title) i DCAT-AP-NO>

Teknisk veiledning

Se tilsvarende eksempel under Datasett - tittel i denne veilederen for hvordan tittel angis i RDF Turtle.

Distribusjon - utgivelsesdato

Dato/tid når distribusjonen først ble publisert i tilknytning til et datasett.

Eksempler
  •  01.01.2017

Teknisk veiledning

Dette tilsvarer Distribusjon: utgivelsesdato (dct:issued) i DCAT-AP-NO.

  • Oppgis som dato (xsd:date) eller tidspunkt (xsd:dateTime).

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dcat:distribution [ a dcat:Distribution ; # distribusjon
    dct:issued "2017-01-01"^xsd:date ] .

Beskrivelse av datatjeneste

Nytt i DCAT-AP-NO v.2 er at standarden nå også støtter beskrivelser av datatjenester, som v.1.x av DCAT-AP-NO ikke gjorde.

Datatjeneste (dcat:DataService) brukes til å beskrive en samling av operasjoner som er tilgjengelig via et programmeringsgrensesnitt (API) og som gir tilgang til ett eller flere datasett eller databehandlingsfunksjoner.

For deg som skal utvikle/tilpasse verktøystøtte i henhold til DCAT-AP-NO, inneholder veilederen også en teknisk veiledning bakerst i hvert avsnitt. NB! Bortsett fra det første eksemplet, er ikke alle eksempler i RDF Turtle komplette og de kan mangle bl.a. verdier for obligatoriske egenskaper.

Eksempel på en datatjenestebeskrivelse

Under er et eksempel på en datatjenestebeskrivelse, hvor uthevede egenskaper er obligatoriske:

Eksempel på en datatjenestebeskrivelse med dummydata, hvor uthevede egenskaper er obligatoriske:

EndepunktsURL: https://example.org/eksAPI (NB! dummy-URL som ikke virker)
Identifikator: https://example.org/eksAPI (NB! dummy-URL som ikke virker)
Tittel: REST-API for eksempler
Endepunktsbeskrivelse: https://example.org/eksAPI.json (NB! dummy-URL som ikke virker)
Format: JSON
Utgiver: Direktoratet for eksempler

Teknisk veiledning

Eksemplet ovenfor i RDF Turtle:

@prefix dcat: <http://www.w3.org/ns/dcat#> .
@prefix dct: <http://purl.org/dc/terms/> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
@prefix : <https://example.org/> .

<enDatatjeneste> a dcat:DataService ; # datatjeneste
  ### obligatoriske egenskaper:
    dcat:endpointURL <https://example.org/eksAPI> ;
    dct:identifier "https://example.org/eksAP"^^xsd:anyURI ;
    dct:title "REST-API for eksempler"@nb ;
  ### anbefalte egenskaper:
    dcat:endpointDescription <https://example.org/eksAPI.json> ;
    dct:format <http://publications.europa.eu/resource/authority/file-type/JSON> ;
    dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/999999999> ; # utgiver, med dummy-org.nr.
  .

Obligatoriske egenskaper i en datatjenestebeskrivelse

Som et minimum skal følgende tas med i en datatjenestebeskrivelse:

  • Datatjeneste - endepunktsURL: rotplassering eller primært endepunkt for tjenesten.

  • Datatjeneste - identifikator: identifikator til datatjenesten.

  • Datatjeneste - tittel: navn på datatjenesten.

Datatjeneste - endepunktsURL

Du skal oppgi rotplassering eller primært endepunkt for tjenesten (en URI).

Eksempel i RDF Turtle:

<enDatatjeneste> a dcat:DataService ;
  dcat:endpointURL <https://example.org/endpoints> .

Datatjeneste - identifikator

Brukes til å oppgi identifikator til datatjenesten.

Se under Om identifikator.

Teknisk veiledning

Dette tilsvarer Datatjeneste: identifikator (dct:identifier) i DCAT-AP-NO.

Datatjeneste - tittel

Du skal oppgi navnet på datatjenesten. Gjentas hvis navnet er i flere språk.

Teknisk veiledning

Dette tilsvarer Datatjeneste: tittel (dct:title) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<enDatatjeneste> a dcat:DataService ;
  dct:title "FDK API endpoints"@en ,
    "FDK API endepunkter"@nb .

Anbefalte egenskaper i en datatjenestebeskrivelse

Følgende opplysninger bør du ta med i en datatjenestebeskrivelse hvis de finnes:

  • Datatjeneste - emneord: emneord (eller tag) som beskriver datatjenesten.

  • Datatjeneste - endepunktsbeskrivelse: beskrivelse av tjenesten.

  • Datatjeneste - format: datatjenestens filformat.

  • Datatjeneste - kontaktpunkt: kontaktpunkt med kontaktopplysninger.

  • Datatjeneste - tema: tema for datatjenesten.

  • Datatjeneste - tilgjengeliggjør datasett: datasett som datatjenesten kan distribuere.

  • Datatjeneste - utgiver: aktør (organisasjon) som er ansvarlig for å gjøre datatjenesten tilgjengelig.

Datatjeneste - emneord

Du bør oppgi emneord (eller tag) som beskriver datatjenesten.

Se beskrivelsen av tilsvarende egenskap i Datasett, Datasett - emneord.

Teknisk veiledning

Dette tilsvarer Datatjeneste: emneord (dcat:keyword) i DCAT-AP-NO.

Datatjeneste - endepunktsbeskrivelse

Du skal oppgi en beskrivelse av tjenesten.

Brukes primært til å lenke til en formalisert beskrivelse av tjenestene som er tilgjengelige via endepunktene, inkludert deres operasjoner, parametere osv. Beskrivelsen skal gi spesifikke detaljer om de faktiske endepunkt-instansene, mens dct:conformsTo brukes til å indikere den generelle standarden eller spesifikasjonen som endepunktene implementerer.

  • Lenke til en maskinlesbar formalisert endepunktbeskrivelse, som for eksempel en Open API (Swagger) beskrivelse [OpenAPI], GraphQL [GraphQL].

  • Dersom en formalisert beskrivelse ikke er mulig, kan det lenkes til en tekstlig beskrivelse

Eksempel i RDF Turtle:

<enDatatjeneste> a dcat:DataService ;
  dcat:endpointDescription <https://raw.githubusercontent.com/Informasjonsforvaltning/fdk-api-endpoints/master/specification/fdk-api-endpoints.yaml> . # peker til en OpenAPI spesifikasjon av tjenesten

Datatjeneste - format

Datatjenestens filformat.

  • EUs kontrollerte liste over File type skal brukes.

  • Kan gjentas for API-er og sluttbrukerapplikasjoner som leverer data i flere formater.

Teknisk veiledning

Dette tilsvarer Datatjeneste: format (dct:format) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<enDatatjeneste> a dcat:DataService ;
  dct:format <http://publications.europa.eu/resource/authority/file-type/JSON_LD> , # JSON-LD
    <http://publications.europa.eu/resource/authority/file-type/RDF_TURTLE> . # RDF Turtle

Datatjeneste - kontaktpunkt

Kontaktpunkt med kontaktopplysninger.

Se beskrivelsen av tilsvarende egenskap i Datasett, Datasett - kontaktpunkt.

Datatjeneste - tema

Tema for datatjenesten. En datatjeneste kan assosieres med flere tema.

For å kunne sortere datatjenesten inn under gitte kategorier er det behov for tema.

Eksempler
  •  Helse (HEAL fra EU-listen)

  •  Helsestasjon (helsestasjon fra LOS)

Teknisk veiledning

Dette tilsvarer Datatjeneste: tema (dcat:theme) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<enDatatjeneste> a dcat:DataService ;
  dcat:theme <http://publications.europa.eu/resource/authority/data-theme/HEAL> , # helse
    <https://psi.norge.no/los/ord/helsestasjon> . # helsestasjon (Helse og omsorg -> Helsetjenester -> Helsestasjon)

Datatjeneste - tilgjengeliggjør datasett

Egenskapen brukes til å referere til datasett som datatjenesten kan distribuere.

Eksempel i RDF Turtle:

<enDatatjeneste> a dcat:DataService ;
  dcat:servesDataset <https://example.org/dataset/123> ,
    <https://example.org/dataset/456> . # peker til 2 datasett.

Datatjeneste - utgiver

Den aktøren (organisasjon) som er ansvarlig for å gjøre datatjenesten tilgjengelig.

  • Skal peke på en virksomhet (juridisk person, organisasjonsledd, underenhet) som er ansvarlig utgiver - ikke leverandør av tjenesten.

  • Det offisielle navnet på virksomheten vil bli hentet fra Enhetsregisteret, men kortform (f.eks. Digdir) kan legges inn av brukeren.

  • Utgiveren av datasettet forvalter sammensetning av dataene, altså datasettet, og ikke nødvendigvis selve dataene.

Eksempler
  •  Arbeids- og velferdsetaten

Teknisk veiledning

Dette tilsvarer Datatjeneste: utgiver (dct:publisher) i DCAT-AP-NO.

Inntil https://data.brreg.no tilbyr gyldig identifikator (foaf:Agent), skal følgende mønster benyttes: https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/{orgnummer}.

Eksempel i RDF Turtle:

<enDatatjeneste> a dcat:DataService ;
  dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/889640782> . #NAV

Valgfrie egenskaper i en datatjenestebeskrivelse

I tillegg til obligatoriske (skal brukes) og anbefalte (bør brukes) egenskaper, er det en del egenskaper som er valgfrie (kan brukes) i en datatjenestebeskrivelse:

  • Datatjeneste - beskrivelse: fritekstbeskrivelse av datatjenesten.

  • Datatjeneste - dokumentasjon: side eller dokument som beskriver datatjenesten.

  • Datatjeneste - følger: regel som definerer den juridiske rammen for datatjenesten.

  • Datatjeneste - i samsvar med: spesifikasjon eller standard som datatjenesten implementerer.

  • Datatjeneste - landingsside: nettside som gir tilgang til datatjenesten, dens distribusjoner og/eller tilleggsinformasjon.

  • Datatjeneste - lisens: lisensen som datatjenesten blir gjort tilgjengelig under.

  • Datatjeneste - medietype: datatjenestens medietype.

  • Datatjeneste - tilgangsrettigheter: informasjon angående tilgang eller begrensninger basert på personvern, sikkerhet eller andre retningslinjer.

  • Datatjeneste - type: datatjenestens type.

Ikke alle valgfrie egenskaper er beskrevet i etterfølgende avsnitt. Se under Hensikt og avgrensning for hvordan du kan melde inn behov for beskrivelser.

Datatjeneste - beskrivelse

Fritekst-beskrivelse av datatjenesten. Gjentas for flere språkversjoner. Se ellers beskrivelsen av tilsvarende felt i Datasett, Datasett - beskrivelse.

  • Kopier gjerne beskrivende informasjon fra dokumentasjonen eller landingssiden

  • Ved behov for formatering av tekst - benytt CommonMark

Teknisk veiledning

Dette tilsvarer Datatjeneste: beskrivelse (dct:description) i DCAT-AP-NO.

Datatjeneste - dokumentasjon

Referanse til en side eller et dokument som beskriver datatjenesten.

Teknisk veiledning

Dette tilsvarer Datatjeneste: dokumentasjon (foaf:page) i DCAT-AP-NO.

Datatjeneste - følger

Se ellers beskrivelsen av tilsvarende felt i Datasett, Datasett - følger.

Datatjeneste - i samsvar med

Referanse til en spesifikasjon eller standard som datatjenesten implementerer.

  • En datatjeneste kan være utviklet i samsvar med en eller flere standarder og/eller spesifikasjoner.

  • Du kan knytte en informasjonsmodell til en datatjeneste ved hjelp av denne egenskapen. Se under Utvalgte temaer for sammenhengen mellom datatjeneste og informasjonsmodell.

  • Vi anbefaler at informasjonsmodellen for endepunktet også inngår som en del av endepunktbeskrivelsen.

Teknisk veiledning

Dette tilsvarer Datatjeneste: i samsvar med (dct:conformsTo) i DCAT-AP-NO.

Datatjeneste - landingsside

Se ellers beskrivelsen av tilsvarende egenskap i Datasett, Datasett - landingsside.

Datatjeneste - lisens

Referanse til lisensen for datasett som datatjenesten realiserer, gjøres tilgjengelig under. Lisens er påkrevd for alle åpne offentlige data.

  • EUs kontrollerte liste over Licence skal brukes, dersom lisensen som benyttes finnes på listen.

  • For åpne data skal en av disse tre lisensene benyttes:

    • Creative Commons Navngivelse 4.0 (CC BY 4.0): http://publications.europa.eu/resource/authority/licence/CC_BY_4_0

    • Creative Commons CC0 1.0 Universal (CC0): http://publications.europa.eu/resource/authority/licence/CC0

    • Norsk lisens for offentlige data (NLOD): http://publications.europa.eu/resource/authority/licence/NLOD_2_0

  • Creative Commons-lisensene anbefales for distribusjoner (og datatjenester) med forventet internasjonal bruk.

Se Veileder for tilgjengeliggjøring av åpne data for mer informasjon om valg av åpne standardlisenser.

Se ellers beskrivelsen av tilsvarende felt i Distribusjon, Distribusjon - lisens.

Teknisk veiledning

Dette tilsvarer Distribusjon: lisens (dct:license) i DCAT-AP-NO.

Datatjeneste - medietype

Se beskrivelsen av tilsvarende egenskap i Distribusjon, Distribusjon - medietype.

Datatjeneste - type

Referanse til et begrep i en kontrollert liste som identifiserer datatjenestens type, for eksempel Spatial data service type.

Teknisk veiledning

Dette tilsvarer Datatjeneste: type (dct:type) i DCAT-AP-NO.

Beskrivelse av katalog

Datasettbeskrivelser fra f.eks. en virksomhet eller et virksomhetsområde kan samles i en datakatalog. Nytt fra v.2.0 av Standard for beskrivelse av datasett, datatjenester og datakatalog (DCAT-AP-NO), er datatjenester som også kan samles i en katalog (f.eks. en API-katalog). Ordet "katalog" brukes derfor videre i dette kapittel.

Hovedhensikten med å beskrive katalogen din er at andre lettere skal kunne forstå hva slags katalog du har.

For at andre lettere skal kunne forstå dine beskrivelser, er det visse spilleregler for hvordan en katalog skal/bør/kan beskrives.

Dette kapittelet forklarer hvordan en katalog beskrives i henhold til kravene i DCAT-AP-NO v.2, dog uten at du må kunne DCAT-AP-NO.

For deg som skal utvikle/tilpasse verktøystøtte for katalogbeskrivelse i henhold til DCAT-AP-NO, inneholder veilederen også en teknisk veiledning bakerst i hvert avsnitt. NB! Bortsett fra det første eksemplet, er ikke alle eksempler i RDF Turtle komplette og de kan mangle bl.a. verdier for obligatoriske egenskaper.

Eksempel på en katalogbeskrivelse

Under er et eksempel på en katalogbeskrivelse, med dummydata, hvor egenskaper med * foran er obligatoriske:

Eksempel på en katalogbeskrivelse med dummydata, hvor uthevede egenskaper er obligatoriske:

Tittel: Oversikt over datasett fra Direks
Beskrivelse: Katalogen inneholder beskrivelse av alle datasett som Direktoratet for eksempler forvalter.
Identifikator: https://example.org/cat/123 (NB! dummy-URL som ikke virker)
Utgiver: Direktoratet for eksempler
Datasett: Eksempeldatasett (lenke til beskrivelsen av dette eksempeldatasettet)
Dekningsområde: Norge

Teknisk veiledning

Eksemplet ovenfor i RDF Turtle:

@prefix dcat: <http://www.w3.org/ns/dcat#> .
@prefix dct: <http://purl.org/dc/terms/> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
@prefix : <https://dexample.org/> .

<https://example.org/cat/123> a dcat:Catalog ;
	### obligatoriske egenskaper:
		dct:title "Oversikt over datasett fra Direks"@nb ;
		dct:description "Katalogen inneholder beskrivelse av alle datasett som Direktoratet for eksempler forvalter."@nb ;
		dct:identifier "https://example.org/cat/123"^^xsd:anyURI ;
		dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/999999999> ; # utgiver, med dummy-org.nr.
	### anbefalte egenskaper:
		dcat:dataset <https://example.org/eksempeldata> ; # peker til en datasettbeskrivelse
		dct:spatial <http://publications.europa.eu/resource/authority/country/NOR> ; # dekningsområde, Norge
	.

Obligatoriske egenskaper i en katalogbeskrivelse

Som et minimum skal følgende tas med i en katalogbeskrivelse:

  • Katalog - beskrivelse: beskrivelse av innholdet i katalogen.

  • Katalog - identifikator: identifikator til katalogen.

  • Katalog - tittel: navn på katalogen.

  • Katalog - utgiver: aktør ansvarlig for å gjøre katalogen tilgjengelig.

Katalog - beskrivelse

For at andre skal kunne vite hva slags katalog du har, skal du oppgi en kort og presis beskrivelse av innholdet i katalogen.

Eksempler
  • Katalog over alle data i Brønnøysundregistrene

Teknisk veiledning

Dette tilsvarer Katalog: beskrivelse (dct:description) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<enKatalog> a dcat:Catalog ;
	dct:description "Katalog over alle data i Brønnøysundregistrene"@nb .

Katalog - identifikator

Identifikatoren er som regel systemgenerert av verktøyet som brukes til å beskrive/publisere en katalog, slik at du som vanlig bruker ikke trenger å oppgi verdien til denne egenskapen manuelt.

Katalog - tittel

For at andre lett skal kunne se hva din katalog omhandler, skal du oppgi et kortfattet navn på katalogen.

  • Angi, uten å liste, innhold den omfatter.

Eksempler
  • Datakatalog for Brønnøysundregistrene

  • Katalog over datatjenester fra Brønnøysundregistrene

Teknisk veiledning

Dette tilsvarer Katalog: tittel (dct:title) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<kat1> a dcat:Catalog ;
	dct:title "Datakatalog for Brønnøysundregistrene"@nb .

<kat2> a dcat:Catalog ;
	dct:title "Katalog over datatjenester fra Brønnøysundregistrene"@nb .

Katalog - utgiver

For at andre skal kunne vite hvem som er aktøren/organisasjonen som er ansvarlig for tilgjengeliggjøring av katalogen, skal utgiver oppgis.

  • Skal peke på en aktør (juridisk person, organisasjonsledd, underenhet).

  • For produsent av katalogen, se Katalog - produsent.

Eksempler
  • Digdir

Teknisk veiledning

Dette tilsvarer Katalog: utgiver (dct:publisher) i DCAT-AP-NO.

Inntil https://data.brreg.no tilbyr gyldig identifikator (foaf:Agent), skal følgende mønster benyttes: https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/{orgnummer}.

Eksempel i RDF Turtle:

<enKatalog> a dcat:Catalog ;
 dct:publisher <https://organization-catalogue.fellesdatakatalog.digdir.no/organizations/991825827> . # Digdir

Anbefalte egenskaper i en katalogbeskrivelse

Følgende opplysninger bør du ta med i en katalogbeskrivelse hvis de finnes:

  • Katalog - datasett: datasettbeskrivelser som er oppført i katalogen.

  • Katalog - dekningsområde: geografisk område som er dekket av katalogen.

  • Katalog - endringsdato: dato for siste oppdatering av katalogen.

  • Katalog - frekvens: oppdateringsfrekvens for katalogen.

  • Katalog - hjemmeside: nettside som fungerer som hovedside for katalogen.

  • Katalog - lisens: lisens som beskriver hvordan katalogen kan viderebrukes.

  • Katalog - opphav: beskrivelse av autentisitet og integritet til innholdet i katalogen.

  • Katalog - språk: språk som brukes i tekstlige beskrivelser av innholdet i katalogen.

  • Katalog - temaer: temaer som er brukt for å klassifisere innholdet i katalogen.

  • Katalog - utgivelsesdato: dato for formell utgivelse (publisering) av katalogen.

Katalog - datasett

Hvis katalogen din er en katalog over datasett, skal datasettbeskrivelsene inkluderes i katalogen ved å bruke denne egenskapen.

  • Egenskapen brukes til å referere til datasettbeskrivelser som er oppført i katalogen.

Teknisk veiledning

Dette tilsvarer Katalog: datasett (dcat:dataset) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<enDataKatalog> a dcat:Catalog ;
	 dcat:dataset <http://brreg.no/catalogs/974760673/datasets/b97e7db3-8e46-4bc4-857e-77d7280b0e9e> ,
      <http://brreg.no/catalogs/974760673/datasets/1ffcb9e4-008b-4333-a372-268f50d01482> . # peker til to datasettbeskrivelser

Katalog - dekningsområde

Dersom katalogen kun har innhold fra visse områder, skal avgrensningen oppgis.

Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - dekningsområde.

Teknisk veiledning

Dette tilsvarer Katalog: dekningsområde (dct:spatial) i DCAT-AP-NO.

Katalog - endringsdato

Dersom katalogens innhold har vært endret, skal dato/tid sist katalogen ble endret oppgis.

Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - endringsdato.

Teknisk veiledning

Dette tilsvarer Katalog: endringsdato (dct:modified) i DCAT-AP-NO.

Katalog - frekvens

Dersom hyppigheten for endring av innholdet i katalogen er kjent, skal den oppgis.

Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - frekvens.

Teknisk veiledning

Dette tilsvarer Katalog: frekvens (dct:accrualPeriodicity) i DCAT-AP-NO.

Katalog - hjemmeside

Dersom katalogen har en egen hjemmeside som f.eks. fungerer som en hovedside for katalogen, skal den oppgis.

Teknisk veiledning

Dette tilsvarer Katalog: hjemmeside (foaf:homepage) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<enKatalog> a dcat:Catalog ;
	foaf:homepage <https://example.org/cat1> . # peker til hovedsiden for katalogen

Katalog - lisens

Dersom katalogen er knyttet til en lisens som bl.a. beskriver hvordan den kan viderebrukes, skal lisensen oppgis.

Se beskrivelsen av den tilsvarende egenskap for Distribusjon, Distribusjon - lisens.

Teknisk veiledning

Dette tilsvarer Katalog: lisens (dct:license) i DCAT-AP-NO.

Katalog - opphav

Hvis det er noe med opphav av katalogen og/eller katalogens innhold som potensielle brukere bør vite om, skal det oppgis.

Eksempler
  • Katalogen ble opprettet og utgitt første gang av Difi som nå heter Digitaliseringsdirektoratet/Digdir

Teknisk veiledning

Dette tilsvarer Katalog: opphav (dct:provenance) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<enKatalog> a dcat:Catalog ;
	dct:provenance [ a dct:ProvenanceStatement ;
	rdfs:label "Katalogen ble opprettet og utgitt første gang av Difi som nå heter Digitaliseringsdirektoratet/Digdir"@nb ;
	] .

Katalog - språk

Språk som brukes i tekstlige metadata som beskriver ressursene i katalogen, bør oppgis.

Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - språk.

Teknisk veiledning

Dette tilsvarer Katalog: språk (dct:language) i DCAT-AP-NO.

Katalog - temaer

Du bør oppgi klassifiseringssystem(er) (f.eks. en taksonomi) som er brukt til å klassifisere innholdet i katalogen din.

Teknisk veiledning

Dette tilsvarer Katalog: temaer (dcat:themeTaxonomy) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<enKatalog> a dcat:Catalog ;
	dcat:themeTaxonomy <http://publications.europa.eu/resource/dataset/eurovoc> , # EuroVoc
		<https://psi.norge.no/los/> . # LOS

Katalog - utgivelsesdato

Du bør oppgi dato/tid katalogen først ble publisert.

Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - utgivelsesdato.

Teknisk veiledning

Dette tilsvarer Katalog: utgivelsesdato (dct:issued) i DCAT-AP-NO.

Valgfrie egenskaper i en katalogbeskrivelse

I tillegg til obligatoriske (skal brukes) og anbefalte (bør brukes) egenskaper, er det en del egenskaper som er valgfrie (kan brukes) i en katalogbeskrivelse:

  • Katalog - datatjeneste: datatjeneste som er oppført i denne katalogen.

  • Katalog - er del av: katalog som denne katalogen fysisk eller logisk er inkludert i.

  • Katalog - har del: katalog som er en del av denne katalogen.

  • Katalog - katalog: annen katalog som er relevant for denne katalogen.

  • Katalog - katalogpost: katalogpost som er oppført i denne katalogen.

  • Katalog - produsent: aktør som er hovedansvarlig for å produsere katalogen.

  • Katalog - rettigheter (brukervilkår): bruksvilkår knyttet til katalogen.

Ikke alle valgfrie egenskaper er beskrevet i etterfølgende avsnitt. Se under Hensikt og avgrensning for hvordan du kan melde inn behov for beskrivelser.

Katalog - datatjeneste

Hvis katalogen din er en katalog over datatjenester (aka APIer), eller datasettene i katalogen din tilbys via datatjenester, skal beskrivelse av datatjenestene inkluderes i katalogen ved å bruke denne egenskapen.

  • Egenskapen brukes til å referere til datatjenestebeskrivelser som er oppført i katalogen.

Teknisk veiledning

Dette tilsvarer Katalog: datatjeneste (dcat:service) i DCAT-AP-NO.

Eksempel i RDF Turtle:

<enKatalog> a dcat:Catalog ;
	dcat:service <https://example.org/dataService1>,
		<https://example.org/dataService2> . # peker til to datatjenester

Katalog - er del av

Se beskrivelsen av den tilsvarende egenskapen for Datasett, Datasett - er del av.

Katalog - produsent

<ikke beskrevet, tilsvarer Katalog: produsent (dct:creator) i DCAT-AP-NO>

Se beskrivelsen av den tilsvarende egenskap for Datasett, Datasett - produsent.

For utgiver av katalogen, bruk Katalog - utgiver.

Utvalgte temaer

Dette kapittelet inneholder noen utvalgte temaer som forklares nærmere. Se under Hensikt og avgrensning for hvordan du kan melde inn behov for temaer som du savner nærmere forklaringer av.

Sammenheng mellom datasett, distribusjon, datatjeneste, begrep og informasjonsmodell

Datasett begrep distribusjon datatjeneste infomod
Figur 1. Sammenheng mellom datasett, distribusjon, datatjeneste, begrep og informasjonsmodell

Figuren over viser sammenhengen mellom datasett, datatjeneste (aka API), begrep og informasjonsmodell:

  • Dataene i et datasett (dcat:Dataset) kan representere (eller forklares med) et eller flere begreper (skos:Concept). Du knytter et begrep (skos:Concept) til et datasett (dcat:Dataset) ved å bruke egenskapen Datasett - begrep (dct:subject) (1).

  • Et datasett (dcat:Dataset) kan distribueres gjennom en eller flere distribusjoner (dcat:Distribution). Du knytter en distribusjon (dcat:Distribution) til et datasett (dcat:Dataset) ved å bruke egenskapen Datasett - datasettdistribusjon (dcat:distribution) (2).

  • Tilgangen til en distribusjon (dcat:Distribution) kan gis via en eller flere datatjenester (dcat:DataService). Du knytter en datatjeneste (dcat:DataService) til en distribusjon (dcat:Distribution) ved å bruke egenskapen Distribusjon - tilgangstjenesten (3).

  • Et datasett (dcat:Dataset) kan være skapt/vedlikeholdt i samsvar med en eller flere standarder/spesifikasjoner (dct:Standard). Du knytter en standard/spesifikasjon (dct:Standard) til et datasett (dcat:Dataset) ved å bruke egenskapen Datasett - i samsvar med (dct:conformsTo) (4). Ettersom en informasjonsmodell (modelldcatno:InformationModel) iht. Spesifikasjon for beskrivelse av informasjonsmodeller (ModellDCAT-AP-NO) er en subklasse av dct:Standard (5), kan du på denne måten knytte en informasjonsmodell til et datasett, dvs. en informasjonsmodell som beskriver strukturen av datasettet.

    • På tilsvarende måte kan du knytte en informasjonsmodell (modelldcatno:InformationModel) til en datatjeneste (dcat:DataService) (6), dvs. en informasjonsmodell som beskriver strukturen av data som datatjenesten distribuerer.

    • Se Spesifikasjon for beskrivelse av informasjonsmodeller (ModellDCAT-AP-NO) for hvordan en informasjonsmodell og modellelementer i en informasjonsmodell beskrives.

  • En datatjeneste (dcat:DataService) kan brukes til å gi tilgang til et eller flere datasett (dcat:Dataset). Du knytter et datasett (dcat:Dataset) til en datatjeneste (dcat:DataService) ved å bruke egenskapen Datatjeneste: tilgjengeliggjør datasett (dcat:servesDataset) (7).

Beskrivelse av kvalitet

Nytt i DCAT-AP-NO v.2 er at den nå benytter DQV (Data Quality Vocabulary) fra W3C for beskrivelse av kvalitet på f.eks. et datasett. DCAT-AP-NO spesifiserer imidlertid ikke i detalj hvordan klasser og egenskaper fra DQV skal/bør/kan brukes. Det er derfor utarbeidet en norsk applikasjonsprofil av DQV (DQV-AP-NO), som supplerer DCAT-AP-NO, hvilket betyr at klasser og egenskaper spesifisert i DQV-AP-NO kan brukes i tillegg til de i DCAT-AP-NO.

Følgende er kun noen eksempler på hvordan DQV-AP-NO brukes til å beskrive kvalitet på f.eks. et datasett.

Beskrivelse av kvantifiserbar kvalitet

Ved å bruke egenskapen Datasett: har måleresultat (dqv:hasQualityMeasurement) kan du knytte et måleresultat (dqv:QualityMeasurement) til et datasett (dcat:Dataset).

Iht. DQV-AP-NO skal et måleresultat (dqv:QualityMeasurement) videre knyttes til ett og bare ett kvalitetsmål (dqv:Metric). Det er predefinert et sett med kvalitetsmål og disse bør brukes når relevant. Predefinerte kvalitetsmål finnes på https://data.norge.no/vocabulary/dqvno (i RDF Turtle).

Videre, iht. DQV-AP-NO skal et kvalitetsmål (dqv:Metric) knyttes til én og bare én kvalitetsdeldimensjon (dvqno:SubDimension) som igjen skal knyttes til én og bare én kvalitetsdimensjon (dqv:Dimension). Ved å bruke predefinerte kvalitetsmål trenger du ikke å oppgi kvalitetsdeldimensjon og kvalitetsdimensjon ettersom de predefinerte kvalitetsmålene er allerede ferdig tilknyttet kvalitetsdeldimensjon og kvalitetsdimensjon.

Eksempler på predefinerte kvalitetsmål, i kvalitetsdeldimensjonen "underdekning" (dvqno:undercoverage) som er i kvalitetsdimensjonen "fullstendighet" (dqvno:completeness):

  • manglende enheter (dqv:missingObjects): hvorvidt det mangler enheter i datasettet.

  • antall manglende enheter (dqvno:numberOfMissigObjects): antall enheter som ikke er i datasettet men som forventes å være med.

  • andel manglende enheter (dqvno:rateOfMissingObjects): antall enheter som mangler i forhold til antall enheter som skulle være med i datasettet.

Eksempler
  • Manglende enheter: 2

  • Kommentar: To bygninger mangler i datasettet.

Teknisk veiledning

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dqv:hasQualityMeasurement [ a dqv:QualityMeasurement ; # måleresultat
    dqv:isMeasurementOf dqvno:numberOfMissingObjects ; # antall manglende enheter
    dqv:value "2"^^xsd:nonNegativeInteger ; # antallet
    rdfs:comment "To bygninger mangler i datasettet."@nb ; # kommentar
    ] .

Beskrivelse av kvalitet i form av fritekst

Ved å bruke egenskapen Datasett: har kvalitetsnote kan du knytte en kvalitetsbeskrivelse i fritekst (dqv:QualityAnnotation) til et datasett (dcat:Dataset).

Iht. DQV-AP-NO er det anbefalt å knytte en kvalitetsnote (dqv:QualityAnnotation) til en eller flere kvalitetsdimensioner (dqv:Dimension), ved å bruke egenskapen dqv:inDimension. Det er predefinert flere kvalitetsdimensjoner og disse bør brukes når relevant. Predefinerte kvalitetsdimensjoner finnes på https://data.norge.no/vocabulary/dqvno (i RDF Turtle).

Eksempler
  • Kvalitetsdimensjon: fullstendighet

  • Kvalitetsnote: Det tar i gjennomsnitt 24 dager fra en bygning står ferdig eller er revet til den er innlemmet i eller tatt ut fra datasettet.

Teknisk veiledning

Iht. DQV-AP-NO skal en kvalitetsnote (dqv:QualityAnnotation) alltid ha en oa:motivatedBy med verdi dqv:qualityAssessment (som er en predefinert instans av oa:Motivation). Selve teksten skal oppgis ved å bruke egenskapen oa:hasBody som peker til en instans av oa:TextualBody.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ; # datasett
  dqv:hasQualityAnnotation [ a dqv:QualityAnnotation ; # kvalitetsnote
    oa:motivatedBy dqv:qualityAssessment ; # obligatorisk "motivasjon"
    dqv:inDimension dqvno:completeness ; # anbefalt kvalitetsdimensjon
    oa:hasBody [ a oa:TextualBody ; # selve teksten
      dct:format <http://publications.europa.eu/resource/authority/file-type/TXT> ; # format
      dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; # språk
      rdfs:value "Det tar i gjennomsnitt 24 dager fra en bygning står ferdig eller er revet til den er innlemmet i eller tatt ut fra datasettet."@nb ;  # teksten
      ] ;
    ] .

Beskrivelse av kvalitet i form av brukertilbakemeldinger

Iht. DQV-AP-NO er en brukertilbakemelding (dqv:UserFeedback) en type kvalitetsnote (dqv:QualityAnnotation). Du kan med andre ord knytte en brukertilbakemelding på kvalitet (dqv:UserQualityFeedback) til et datasett (dcat:Dataset), på tilsvarende måte som beskrivelse av kvalitet i form av fritekst. Se også Beskrivelse av kvalitet i form av fritekst for obligatoriske og anbefalte krav som også gjelder for brukertilbakemelding (dqv:UserFeedback) her.

Eksempler
  • Kvalitetsdimensjon: fullstendighet

  • Brukertilbakemelding: 24 dagers etterslep er mer enn bra nok for vårt statistiske formål.

Teknisk veiledning

Eksempel i RDF Turle:

<etDatasett> a dcat:Dataset ; # datasett
  dqv:hasQualityAnnotation [ a dqv:UserQualityFeedback ; # brukertilbakemelding
    oa:motivatedBy dqv:qualityAssessment ; # obligatorisk "motivasjon"
    dqv:inDimension dqvno:completeness ; # anbefalt kvalitetsdimensjon
    oa:hasBody [ a oa:TextualBody ; # selve teksten
      dct:format <http://publications.europa.eu/resource/authority/file-type/TXT> ; # format
      dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; # språk
      rdfs:value "24 dagers etterslep er mer enn bra nok for vårt statistiske formål."@nb ;  # teksten
      ] ;
    ] .

Beskrivelse av at et datasett er autoritativt

Iht. DQV-AP-NO er et kvalitetssertifikat (dqv:QualityCertificate) en type kvalitetsnote (dqv:QualityAnnotation). Du kan med andre ord knytte et kvalitetssertifikat (dqv:QualityCertificate) til et datasett (dcat:Dataset), på tilsvarende måte som beskrivelse av kvalitet i form av fritekst. Se også Beskrivelse av kvalitet i form av fritekst for obligatoriske og anbefalte krav som også gjelder for kvalitetssertifikat (dqv:QualityCertificate) her.

Eksempler
  • Autoritativ kilde: ja

Teknisk veiledning

Vokabularet https://data.norge.no/vocabulary/dqvno (i RDF) inneholder et predefinert kvalitetssertifikat, dqvno:isAuthoritative, som er en "kvalitetsbeskrivelse som uttrykker at noe er autoritativt". Dette predefinerte kvalitetssertifikatet bør du bruke når du ønsker å si at et datasett er autoritativt.

Eksempel i RDF Turtle:

<etDatasett> a dcat:Dataset ;
  dqv:hasQualityAnnotation dqvno:isAuthoritative . # datasettet er autoritativt

Beskrivelse av at kvaliteten er i samsvar med gitt standard/spesifikasjon

Ved å bruke egenskapen Datasett - i samsvar med kan du knytte en standard/spesifikasjon (dct:Standard) til et datasett (dcat:Dataset), for å informere om at datasettet er generert/vedlikeholdt i henhold til gitt(e) standard(er)/spesifikasjon(er).

Se Datasett - i samsvar med for hvordan egenskapen brukes.

Beskrivelse av juridiske rammer

For å knytte f.eks. en lovhjemmel til et datasett eller en datatjeneste, er det to steg (her under med utgangspunkt i datasett):

  1. Et datasett (dcat:Dataset) kan referere til en eller flere regler (cpsv:Rule) ved hjelp av egenskapen Datasett: følger (cpsv:follows). Vokabularet cpsvno inneholder p.t. følgende predefinerte instanser av cpsv:Rule, og disse bør brukes når relevant:

    • behandlingsgrunnlag (cpsvno:ruleForDataProcessing): regel som regulerer behandling av data, spesielt personopplysninger

    • utleveringsregel (cpsvno:ruleForDisclosure): regel som regulerer utlevering av en ressurs (f.eks. et datasett)

    • skjermingsregel (cpsvno:ruleForNonDisclosure): regel som regulerer skjerming av en ressurs (f.eks. et datasett)

  2. En regel (cpsv:Rule) kan referere til en eller flere regulative ressurser (eli:LegalResource) ved hjelp av egenskapen Regel: implementerer (cpsv:implements). Et eksempel på en regulativ ressurs er en lovhjemmel.

    • Egenskapen Regulativ ressurs: type (dct:type) er iht. DCAT-AP-NO obligatorisk for en regulativ ressurs (eli:LegalResource).

Teknisk veiledning

Se under Datasett - følger for eksempel i RDF Turtle.

Beskrivelse av tidsserie/datasettserie

For å beskrive datasett som inneholder en serie av datasett, anbefaler DCAT-AP-NO å bruke egenskapen Datasett: har del ("består av", dct:hasPart). Den motsatte egenskapen Datasett: er del av ("inngår i", dct:isPartOf) kan brukes til å knytte et datasett til en datasettserie.

Eksempler
  • Datasettet "årsregnskap" består av datasettene "regnskap2017" og "regnskap2018"

  • Datasettet "regnskap2017" og "regnskap2018" inngår i datasettet "årsregnskap"

Teknisk veiledning

Eksempel i RDF Turtle:

<årsregnskap> a dcat:Dataset ;
   dct:hasPart <regnskap2017>, <regnskap2018> .

<regnskap2017> a dcat:Dataset ;
   dct:isPartOf <årsregnskap> ;
   dct:temporal [a dct:PeriodOfTime ;
   dcat:startDate "2017-01-01"^^xsd:date ;
   dcat:endDate "2017-12-31"^^xsd:date ; ] .

<regnskap2018> a dcat:Dataset ;
   dct:isPartOf <årsregnskap> ;
   dct:temporal [a dct:PeriodOfTime ;
   dcat:startDate "2018-01-01"^^xsd:date ;
   dcat:endDate "2018-12-31"^^xsd:date ; ] .
I skrivende stund holder W3C på å utarbeide v.3.0 av DCAT hvor det skal være en løsning for å kunne beskrive en "Datasettserie" mer presist. Den foreslåtte løsningen p.t. ser ut til å bruke en ny klasse "Datasettserie" (dcat:DatasetSeries) som er en subklasse av Datasett (dcat:Dataset), og datasettene (dcat:Dataset) knyttes til serien (dcat:DatasetSeries) ved å bruke en ny egenskap "Datasett - iSerie" (dcat:inSeries) som er en subegenskap av dct:isPartOf. Det diskuteres p.t. om det også skal innføres en ny egenskap "Datasettserie - seriemedlem" (dcat:seriesMember) som er den inverse av egenskapen dcat:inSeries og som er en subegenskap av dct:hasPart. Løsningen, når den vedtas i W3C og også tas i bruk av EU, er med andre en mer presis måte å bruke klassen Datasett (dcat:Dataset) og egenskapen erDelAv (dct:isPartOf). Inntil videre bruker vi dct:isPartOf eller dct:hasPart til å beskrive tidsserier/dataserier, som beskrevet ovenfor.

Beskrivelse av åpne data

Et datasett kan gjøres tilgjengelig via distribusjon(er) og/eller datatjeneste(r). Se ellers under Sammenheng mellom datasett, begrep, distribusjon, datatjeneste og informasjonsmodell for sammenheng mellom bl.a. datasett (dcat:Dataset), distribusjon (dcat:Distribution) og datatjeneste (dcat:DataService).

Åpne data via distribusjon(er)

Åpne data kan tilgjengeliggjøres via distribusjoner. For at et datasett (dcat:Dataset) skal kunne betraktes som et datasett med åpne data, skal følgende oppfylles:

  1. Datasettet skal være offentlig tilgjengelig. Egenskapen Datasett: tilgangsnivå (dct:accessRights) skal med andre ord ha verdi offentlig (http://publications.europa.eu/resource/authority/access-right/PUBLIC).

  2. Datasettet er gjort tilgjengelig. Egenskapen Datasett: datasettdistribusjon (dcat:distribution) skal med andre ord ha minst én verdi, dvs. det skal være minst én distribusjon av datasettet.

  3. Datasettet er gjort tilgjengelig med minst én distribusjon som er tilknyttet en åpen lisens. Egenskapen Distribusjon: lisens (dct:license) til minst én av distribusjonene (hvis flere distribusjoner) til datasettet skal med andre ord referere til en åpen lisens. Se Distribusjon - lisens for mer om åpne lisenser.

    1. Når tilgangen til distribusjonen som er tilknyttet en åpen lisens gis via en eller flere datatjenester (dcat:DataService) ved hjelp av egenskapen Distribusjon: tilgangstjeneste (dcat:accessService), skal minst én av datatjenestene (hvis flere datatjenester) i tillegg også være tilknyttet en åpen lisen. Egenskapen Datatjeneste: lisens (dct:license) til minst én av datatjenestene (hvis flere) skal med andre ord referere til en åpen lisens. Se Distribusjon - lisens for mer om åpne lisenser.

Teknisk veiledning

Eksempel i RDF Turtle:

<etDatasettMedÅpneData> a dcat:Dataset ; # datasett
   dct:accessRights <http://publications.europa.eu/resource/authority/access-right/PUBLIC> ; # offentlig tilgjengelig (pkt.1)
   dcat:distribution [ a dcat:Distribution ; # en distribusjon (pkt.2)
      dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ; # en åpen lisens (pkt.3)
      dcat:accessService [ a dcat:DataService ; # datatjeneste
        dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ; # en åpen lisens (pkt.3a)
        ] ;
      ] .

Åpne data via datatjeneste (aka API)

En datatjeneste (dcat:Dataservice) kan gi tilgang til åpne data. For at en datatjeneste (dcat:DataService) skal kunne sies å gi tilgang til datasett (dcat:Dataset) med åpne data, skal følgende oppfylles:

  1. Datatjenesten (dcat:DataService) skal tilbys under en åpen lisens. Egenskapen Datatjeneste: lisens (dct:license) skal med andre ord referere til en åpen lisens. Se Distribusjon - lisens for mer om åpne lisenser.

  2. Datatjenesten gir tilgang til data. Egenskapen Datatjeneste: tilgjengeliggjør datasett (dcat:servesDataset) skal med andre ord referere til minst ett datasett (dcat:Dataset).

  3. Alle (hvis flere) datasett (dcat:Dataset) som datatjenesten gir tilgang til, skal være offentlig tilgjengelige. Egenskapen Datasett: tilgangsnivå (dct:accessRights) til alle datasettene skal med andre ord ha verdi offentlig (http://publications.europa.eu/resource/authority/access-right/PUBLIC).

Teknisk veiledning

Eksempel i RDF Turtle:

<enDatatjeneste> a dcat:DataService ; # datatjeneste
  dct:license <http://publications.europa.eu/resource/authority/licence/CC_BY_4_0> ; # en åpen lisens (pkt.1)
  dcat:servesDataset [ a dcat:Datasett ; # datasett (pkt.2)
    dct:accessRights <http://publications.europa.eu/resource/authority/access-right/PUBLIC> ; # offentlig tilgjengelig (pkt.3)
    ] .

Bruk av kontrollerte vokabularer

Til flere av egenskaper er det krav til obligatorisk eller anbefalt bruk av kontrollerte vokabularer. Dette betyr at verdiene til de aktuelle egenskapene skal (obligatorisk bruk) eller bør (anbefalt bruk) hentes fra en eller flere av angitte kontrollerte lister. Se Om bruk av kontrollerte vokabularer i DCAT-AP-NO, for hvilke kontrollerte vokabularer som skal/bør brukes for hvilke egenskaper.

Om identifikator (dct:identifer)

Identifikatoren til en ressurs (et datasett, en datatjeneste, en katalog osv.) er som regel systemgenerert av verktøystøtte, slik at du som vanlig bruker ikke trenger å fylle ut verdien til denne egenskapen manuelt.

Teknisk veiledning

Beskrivelsen tar utgangspunkt i indikatoren til et datasett (tilsvarende Datasett: identifikator (dct:identifier) i DCAT-AP-NO), men den gjelder også for de andre klassene i DCAT-AP-NO der dct:identifier brukes.

Identifikatoren til et datasett skal være unik og varig. Se Forvaltningsstandard for pekere til offentlige ressurser på nett.

Subjektet (det første leddet) i en RDF-trippel er per definisjon en identifikator (URI). I en konkret realisering vil instanser av klassen Datasett (dcat:Dataset) derfor få en «innebygd» identifikator.

For å ha minst mulig avvik fra EU-standarden som DCAT-AP-NO er basert på, har vi beholdt krav på at dct:identifier er obligatorisk for dcat:Dataset. dct:identifier trenger ikke å inneholde den samme identifikatoren som den innebygde URIen i en trippel, men når det er den samme identifikatoren, anbefales det at hele den innebygde URIen (subjektet i en trippel) kopieres til dct:identifier.

Eksempel i RDF Turtle:

<https://example.org/dataset/123> a dcat:Dataset ;
   dct:identifier "https://example.org/dataset/123"^^xsd:anyURI .