Beskrive tilgjengeliggjøring via distribusjon/filnedlasting
Nå har vi oppgitt ganske mye informasjon om datasettet, men vi har fortsatt ikke beskrevet hvordan andre kan få tak i dataen og laste den ned. Siden vi tilbyr dataen som en fil fra Github kan vi beskrive det som en Distribusjon og legge til informasjon om den.
Merk: Vi skiller mellom Datasett, Distribusjon og Datatjeneste/API for å tydeliggjøre at et datasett kan tilgjengeliggjøres på flere måter. I denne sammenhengen er datasett en ganske abstrakt ting, mens de konkrete filene og endepunktene du kan hente dataen fra kalles for distribusjon og datatjeneste.
Vi må først si at datasettet har en distribusjon, til det bruker vi dcat:distribution
som skal peke til en Distribusjonsressurs vi beskriver under.
<https://data.digdir.no/datasets/ai_projects_norwegian_state_dataset> rdf:type dcat:Dataset ; # ... dcat:distribution <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> ; . <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution .
Her har vi definert en ny ressurs som vi gir URI https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution
og sier at er av typen dcat:Distribution
.
Tilgangs-URL og nedlastings-URL
Datasettet er tilgjengelig som filnedlasting fra Digdir sin Github-side, https://github.com/Informasjonsforvaltning/ai-project-service/blob/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv
, og vi kan peke til denne med egenskapen dcat:accessURL
. Dette er den eneste obligatoriske egenskapen for en distribusjonsbeskrivelse.
Men vi vil også legge til noe mer informasjon, f.eks. direktelenken til filen: https://raw.githubusercontent.com/Informasjonsforvaltning/ai-project-service/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv
, den kan vi peke til med dcat:downloadURL
. Distribusjon-beskrivelsen vil da se slik ut:
<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dcat:accessURL <https://github.com/Informasjonsforvaltning/ai-project-service/blob/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; dcat:downloadURL <https://raw.githubusercontent.com/Informasjonsforvaltning/ai-project-service/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; .
Tekstlig beskrivelse og utgivelsesdato
Vi legger til en tekstlig beskrivelse av distribusjonen, og når den ble utgitt, og bruker feltene dct:description
og dct:issued
til det:
<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dct:description "CSV-fil med oversikt over kunstig intelligens-prosjekter i offentlig sektor"@nb ; dct:issued "2023-02-23"^^xsd:date ; .
Lisens
Distribusjonen har en CC0-lisens, som vi angir med egenskapen dct:license
. Denne egenskapen skal peke til et kontrollert vokabular/kodeliste fra EU.
<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dct:license <http://publications.europa.eu/resource/authority/licence/CC0> ; .
Eksempler på noen andre lisenser fra EUs kodeliste er:
http://publications.europa.eu/resource/authority/licence/APACHE_2_0
http://publications.europa.eu/resource/authority/licence/CC0
http://publications.europa.eu/resource/authority/licence/CC_BY_4_0
Format og språk
Vi vil oppgi formatet til filen, som i vårt tilfelle er en CSV-fil; til det bruker vi egenskapen dct:format
og peker til en kode i EU sitt vokabular "File Type" som representerer CSV.
I tillegg er innholdet i datasett på norsk - bokmål. Vi angår det med egenskapen dct:language
og peker til koden fra EU sitt vokabular som angir norsk - bokmål:
<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> ; dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; .
Kompett beskrivelse av distribusjon
Hele distribusjons-beskrivelsen vil da se slik ut:
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix foaf: <http://xmlns.com/foaf/0.1/> . @prefix dcat: <http://www.w3.org/ns/dcat#> . @prefix dct: <http://purl.org/dc/terms/> . @prefix prov: <http://www.w3.org/ns/prov#> . @prefix vcard: <http://www.w3.org/2006/vcard/ns#> . <https://data.digdir.no/datasets/ai_projects_norwegian_state_dataset> rdf:type dcat:Dataset ; # ... dcat:distribution <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> ; . <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dcat:accessURL <https://github.com/Informasjonsforvaltning/ai-project-service/blob/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; dcat:downloadURL <https://raw.githubusercontent.com/Informasjonsforvaltning/ai-project-service/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; dct:description "CSV-fil med oversikt over kunstig intelligens-prosjekter i offentlig sektor"@nb ; dct:issued "2023-02-23"^^xsd:date ; dct:license <http://publications.europa.eu/resource/authority/licence/CC0> ; dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> ; dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; .