1. Kartlegging
Merk: Virksomheten du jobber for følger kanskje Orden i eget hus-veilederen og du er en del av denne prosessen. Dette er en grundig og nyttig veileder for å få oversikt over hvilke data virksomheten sitter på og som den kan dele med andre. Selv om virksomheten ikke har fullført alle stegene i veilederen kan dere gjerne publisere informasjon om de datasettene dere allerede har kartlagt. Beskrivelsene kan gradvis forbedres og utvides etter hvert som dere kommer videre i arbeidet med Orden i eget hus.
Aller først må du vite hvilke datasett du vil beskrive, og informasjon som kan være nyttig å ha klart for hvert datasett er:
- Hva tittel på datasettet skal være.
- Hvordan du tekstlig vil beskrive datasettet.
- Oversettelser av tittel og beskrivelse, sånn at det er tilgjengelig på bokmål, nynorsk og engelsk.
- Hvilken virksomhet som eier og utgir datasettet og virksomhetens organisasjonsnummer.
- Kontaktinformasjon (epost) til de som er ansvarlig for datasettet.
- Om datasettet skal tilbys åpent
- og i så fall, om det er tilgjengelig via filnedlasting eller API
Tips: Spørsmål om hvorvidt datasettet skal tilbys åpent eller være lukket, og hvilke lisenser som skal brukes må ofte vurderes av jurister. Mens dere gjør disse avklaringene kan du fortsatt publisere all den andre informasjonen. Når dere har blitt enig om hvorvidt datasettet skal være åpent, hvordan det skal tilgjengeliggjøres og hvilke lisenser som gjelder, kan du utvide beskrivelsen med denne informasjonen.
Eksempel på kartlegging: KI-prosjekter i offentlig sektor
Digdir tilbyr et datasett med oversikt over KI-prosjekter i offentlig sektor. I beskrivelsen av dette datasettet vil vi ha med i alle fall følgende informasjon: - Tittelen er "Kunstig intelligens - oversikt over prosjekter i offentlig sektor". - Bokmålsbeskrivelsen er "En oversikt over kunstig intelligens-prosjekter i offentlig sektor. Oversikten er ikke komplett." - Oversettelse til nynorsk og engelsk legger vi til etterpå. - Utgiveren er Digitaliseringsdirektoratet, med organisasjonsnummer 991825827. - De ansvarlige for datasettet i Digdir kan kontaktes på eposten postmottak@digdir.no - At datasettet kan knyttes til temaet "offentlig forvaltning", ved hjelp av en kode fra en felles kodeliste. - Hvordan dette gjøres viser vi senere i veiledningen.
Dette er all informasjonen som trengs for å dekke de obligatoriske feltene for en datasettbeskrivelse. Det er i tillegg et par andre ting vi ønsker å ta med for at datasettet skal være enkelt å finne og ta i bruk for andre:
- Datasettet har en egen nettside: https://data.norge.no/kunstig-intelligens
- Datasettet er tilgjengelig som filnedlasting fra Digdir sin Github-side.
- Datasettet tilbys/distribueres som CSV-fil
- Datasettet er åpent og tilgjengelig, og lisensiert med CC0 "No Rights Reserved"-lisensen.
- Innholdet i datasettet er på bokmål.
- Datasettet ble utgitt 23. februar 2023.
- Datasettet kan knyttes til nøkkelordene "kunstig intelligens" og "offentlig sektor".
- Datasettet er basert på innsamling av informasjon fra tredjeparter.