Beskrive tilgjengeliggjøring via distribusjon/filnedlasting

Nå har vi oppgitt ganske mye informasjon om datasettet, men vi har fortsatt ikke beskrevet hvordan andre kan få tak i dataen og laste den ned. Siden vi tilbyr dataen som en fil fra Github kan vi beskrive det som en Distribusjon og legge til informasjon om den.

Merk: Vi skiller mellom Datasett, Distribusjon og Datatjeneste/API for å tydeliggjøre at et datasett kan tilgjengeliggjøres på flere måter. I denne sammenhengen er datasett en ganske abstrakt ting, mens de konkrete filene og endepunktene du kan hente dataen fra kalles for distribusjon og datatjeneste.

Vi må først si at datasettet har en distribusjon, til det bruker vi dcat:distribution som skal peke til en Distribusjonsressurs vi beskriver under.

<https://data.digdir.no/datasets/ai_projects_norwegian_state_dataset> rdf:type dcat:Dataset ; # ... dcat:distribution <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> ; . <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution .

Her har vi definert en ny ressurs som vi gir URI https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution og sier at er av typen dcat:Distribution.

Tilgangs-URL og nedlastings-URL

Datasettet er tilgjengelig som filnedlasting fra Digdir sin Github-side, https://github.com/Informasjonsforvaltning/ai-project-service/blob/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv, og vi kan peke til denne med egenskapen dcat:accessURL. Dette er den eneste obligatoriske egenskapen for en distribusjonsbeskrivelse.

Men vi vil også legge til noe mer informasjon, f.eks. direktelenken til filen: https://raw.githubusercontent.com/Informasjonsforvaltning/ai-project-service/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv, den kan vi peke til med dcat:downloadURL. Distribusjon-beskrivelsen vil da se slik ut:

<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dcat:accessURL <https://github.com/Informasjonsforvaltning/ai-project-service/blob/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; dcat:downloadURL <https://raw.githubusercontent.com/Informasjonsforvaltning/ai-project-service/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; .

Tekstlig beskrivelse og utgivelsesdato

Vi legger til en tekstlig beskrivelse av distribusjonen, og når den ble utgitt, og bruker feltene dct:description og dct:issued til det:

<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dct:description "CSV-fil med oversikt over kunstig intelligens-prosjekter i offentlig sektor"@nb ; dct:issued "2023-02-23"^^xsd:date ; .

Lisens

Distribusjonen har en CC0-lisens, som vi angir med egenskapen dct:license. Denne egenskapen skal peke til et kontrollert vokabular/kodeliste fra EU.

<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dct:license <http://publications.europa.eu/resource/authority/licence/CC0> ; .

Eksempler på noen andre lisenser fra EUs kodeliste er:

  • http://publications.europa.eu/resource/authority/licence/APACHE_2_0
  • http://publications.europa.eu/resource/authority/licence/CC0
  • http://publications.europa.eu/resource/authority/licence/CC_BY_4_0

Format og språk

Vi vil oppgi formatet til filen, som i vårt tilfelle er en CSV-fil; til det bruker vi egenskapen dct:format og peker til en kode i EU sitt vokabular "File Type" som representerer CSV. I tillegg er innholdet i datasett på norsk - bokmål. Vi angår det med egenskapen dct:language og peker til koden fra EU sitt vokabular som angir norsk - bokmål:

<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> ; dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; .

Kompett beskrivelse av distribusjon

Hele distribusjons-beskrivelsen vil da se slik ut:

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix foaf: <http://xmlns.com/foaf/0.1/> . @prefix dcat: <http://www.w3.org/ns/dcat#> . @prefix dct: <http://purl.org/dc/terms/> . @prefix prov: <http://www.w3.org/ns/prov#> . @prefix vcard: <http://www.w3.org/2006/vcard/ns#> . <https://data.digdir.no/datasets/ai_projects_norwegian_state_dataset> rdf:type dcat:Dataset ; # ... dcat:distribution <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> ; . <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dcat:accessURL <https://github.com/Informasjonsforvaltning/ai-project-service/blob/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; dcat:downloadURL <https://raw.githubusercontent.com/Informasjonsforvaltning/ai-project-service/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; dct:description "CSV-fil med oversikt over kunstig intelligens-prosjekter i offentlig sektor"@nb ; dct:issued "2023-02-23"^^xsd:date ; dct:license <http://publications.europa.eu/resource/authority/licence/CC0> ; dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> ; dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; .