Sette opp datakilde som data.norge.no henter beskrivelsen fra

Når vi nå har den fullstendige beskrivelsen må vi tilby den fra et datakilde som er tilgjengelig. Datakilden (eller endepunktet) må tilby (engelsk: serve) filen i et gyldig RDF-format, for eksempel Turtle. Da kan data.norge.no høste, eller "hente" katalogen fra og vise innholdet på data.norge.no.

Merk: Hvis virksomheten din allerede har en datakatatalog som høstes av data.norge.no trenger du ikke å registrere et eget endepunkt for din ene datasettbeskrivelse. Du må bare sørge for at datasettbeskrivelsen din inkluderes i datakatalogen til virksomheten.

Vi laster opp eksempel-filen med beskrivelse av KI-oversikten til Github med filnavn ai_projects_norwegian_state_dataset_description.ttl. Selve filen kan da nås over nett på URL-en https://raw.githubusercontent.com/Informasjonsforvaltning/ai-project-service/main/ai_projects_norwegian_state_dataset_description.ttl. Denne URL-en skal vi bruke når vi registrerer datakilden.

Registrere datakilde i administrasjonsportalen

Det neste vi må gjøre er å registrere datakilden i administrasjonsportalen til data.norge.no. Du logger inn på via siden https://data.norge.no/publishing hvor du trykker på "Logg inn for å administrere høsting".

Merk: Du må ha de riktige tilgangene og rettighetene for å kunne registrere datakilde på vegne av virksomheten. Les mer om hvordan få tilgang til data.norge.no sine løsninger.

Når du er inne i administrasjonsportalen, trykker du på knappen "Legg til datakilde".

Legg til datakilde

Sjekk at utgiveren er riktig, dette skal være virksomheten som utgir datasettet.

Digitaliseringsdirektoratet er valgt som Utgiver

Merk: Om du ikke ser virksomheten din her må du sjekke at du har de riktige tilgangene og rettighetene på vegne av virksomheten.

Katalog skal være "Datasett" og Datakildetype skal være "DCAT-AP-NO".

Datasett er valgt under Katalog

DCAT-AP-NO er valgt for Datakildetype

Formatet (i vårt tilfelle) er Turtle, men her velger du RDF-formatet du tilbyr beskrivelsen i din.

Turtle er valgt for Format

Navn på datakilde brukes kun i administrasjonsportalen sin visning av alle datakildene. Den er kun ment for at virksomheten skal holde oversikt over datakildene sine og vises ikke utad.

Navn på datakilde er fylt ut med "Datakatalog for Digitaliseringsdirektoratet"

URL til datakilde skal være URL-en til der du tilbyr databeskrivelsen fra. I vårt tilfelle er det URL-en https://raw.githubusercontent.com/Informasjonsforvaltning/ai-project-service/main/ai_projects_norwegian_state_dataset_description.ttl.

URL til datakilde er fylt ut med lenke til filen på Github

Vi har ingen autentisering på denne datakilde, så vi lar de feltene stå tomme: De to feltene under Autentisering - HTTP Header står tomme

Deretter trykker du "Lagre".

Datakilden skal nå vises i listen over datakilder. Vår ser sånn slik ut: Oppføringen "Datakatalog for Digitaliseringsdirektoratet" vises, med informasjon om utgiver, URI til datakilden, format, og med knappene Høst, Høstestatus, Rediger, Valider og Slett

Merk: Du kan validere beskrivelsen ved å trykke "Valider". Du blir da tatt til data.norge.no sitt valideringsverktøy for beskrivelser.

Starte høsting

Du kan starte en høsting ved å trykke på "Høst", da henter data.norge.no beskrivelsen og prosesserer den før den vises på data.norge.no. Denne prosessen kan ta noen minutter.