Beskrive tilgjengeleggjering via distribusjon/filnedlasting
No har vi oppgitt ganske mykje informasjon om datasettet, men vi har framleis ikkje beskrive korleis andre kan få tak i dataen og laste den ned. Sidan vi tilbyr dataen som ei fil frå Github kan vi beskrive det som ein Distribusjon og leggje til informasjon om den.
Merk: Vi skiller mellom Datasett, Distribusjon og Datatjeneste/API for å tydeleggjere at eit datasett kan tilgjengeleggjast på fleire måtar. I denne samanhengen er datasett ein ganske abstrakt ting, medan dei konkrete filene og endepunkta du kan hente dataen frå kallast for distribusjon og datatjeneste.
Vi må fyrst seie at datasettet har ei distribusjon, til det bruker vi dcat:distribution
som skal peike til ein Distribusjonsressurs vi beskriver under.
<https://data.digdir.no/datasets/ai_projects_norwegian_state_dataset> rdf:type dcat:Dataset ; # ... dcat:distribution <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> ; . <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution .
Her har vi definert ein ny ressurs som vi gir URI https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution
og seier at er av typen dcat:Distribution
.
Tilgangs-URL og nedlastings-URL
Datasettet er tilgjengeleg som filnedlasting frå Digdir sin Github-side, https://github.com/Informasjonsforvaltning/ai-project-service/blob/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv
, og vi kan peike til denne med eigenskapen dcat:accessURL
. Dette er den einaste obligatoriske eigenskapen for ei distribusjonsbeskriving.
Men vi vil også leggje til noko meir informasjon, til dømes direktelenka til filen: https://raw.githubusercontent.com/Informasjonsforvaltning/ai-project-service/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv
, den kan vi peike til med dcat:downloadURL
. Distribusjon-beskrivinga vil då sjå slik ut:
<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dcat:accessURL <https://github.com/Informasjonsforvaltning/ai-project-service/blob/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; dcat:downloadURL <https://raw.githubusercontent.com/Informasjonsforvaltning/ai-project-service/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; .
Tekstlig beskriving og utgivingsdato
Vi leggjer til ei tekstleg beskrivning av distribusjonen, og når den blei utgitt, og bruker felta dct:description
og dct:issued
til det:
<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dct:description "CSV-fil med oversikt over kunstig intelligens-prosjekter i offentlig sektor"@nb ; dct:issued "2023-02-23"^^xsd:date ; .
Lisens
Distribusjonen har ein CC0-lisens, som vi angir med eigenskapen dct:license
. Denne eigenskapen skal peike til eit kontrollert vokabular/kodeliste frå EU.
<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dct:license <http://publications.europa.eu/resource/authority/licence/CC0> ; .
Døme på nokre andre lisenser frå EUs kodeliste er:
http://publications.europa.eu/resource/authority/licence/APACHE_2_0
http://publications.europa.eu/resource/authority/licence/CC0
http://publications.europa.eu/resource/authority/licence/CC_BY_4_0
Format og språk
Vi vil oppgi formatet til fila, som i vårt tilfelle er ei CSV-fil; til det bruker vi eigenskapen dct:format
og peiker til ein kode i EU sitt vokabular "File Type" som representerer CSV.
I tillegg er innhaldet i datasett på norsk - bokmål. Vi angir det med eigenskapen dct:language
og peiker til koden frå EU sitt vokabular som angir norsk - bokmål:
<https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> ; dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; .
Kompett beskriving av distribusjon
Heile distribusjons-beskrivinga vil då sjå slik ut:
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix foaf: <http://xmlns.com/foaf/0.1/> . @prefix dcat: <http://www.w3.org/ns/dcat#> . @prefix dct: <http://purl.org/dc/terms/> . @prefix prov: <http://www.w3.org/ns/prov#> . @prefix vcard: <http://www.w3.org/2006/vcard/ns#> . <https://data.digdir.no/datasets/ai_projects_norwegian_state_dataset> rdf:type dcat:Dataset ; # ... dcat:distribution <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> ; . <https://data.digdir.no/datasets/ai_projects_norwegian_state_distribution> rdf:type dcat:Distribution ; dcat:accessURL <https://github.com/Informasjonsforvaltning/ai-project-service/blob/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; dcat:downloadURL <https://raw.githubusercontent.com/Informasjonsforvaltning/ai-project-service/main/ai_projects_norwegian_state%20-%20Oversatt_v1.csv> ; dct:description "CSV-fil med oversikt over kunstig intelligens-prosjekter i offentlig sektor"@nb ; dct:issued "2023-02-23"^^xsd:date ; dct:license <http://publications.europa.eu/resource/authority/licence/CC0> ; dct:format <http://publications.europa.eu/resource/authority/file-type/CSV> ; dct:language <http://publications.europa.eu/resource/authority/language/NOB> ; .