Tjenesteartikkel: Innsamling og lagring av forskningsdata
Viktige momenter er datainnsamling, tilgjengelige lagringsløsninger, informasjonssikkerhet og verktøy for samhandling og deling.
Merk at «lagring» viser til data som er i aktiv bruk, mens langtidsbevaring av ferdige data i et egnet dataarkiv betegnes som «arkivering».
Se også artikkel om innsamling og lagring under temaartiklene om Forskningsdata.
Datainnsamling
Det er viktig å kunne støtte god dataflyt gjennom hele den aktive forskningsprosessen, og dette inkluderer innsamling og generering av data. Data er ofte sårbare når de flyttes mellom ulike enheter, og det er nødvendig med gode systemer for innsamling og overføring. Hvis det er snakk om sensitive data, stilles det ekstra krav til sikkerhet og forsvarlig håndtering. Det kreves derfor god oversikt over hva institusjonen tilbyr av løsninger for sikker innsamling av personopplysninger, og det kan være nyttig å utarbeide en guide for forskere og studenter.
Valg av verktøy og løsninger for lagring
Bibliotekets støttetjenester for lagring av forskningsdata er naturlig nok nært knyttet til hva institusjonen tilbyr av lagringsløsninger og verktøy. Det er derfor viktig å skaffe oversikt over de aktuelle lagringsløsningene ved institusjonen, vite hvilke behov de dekker, og avklare hvorvidt det er åpenbare mangler med tanke på krav og retningslinjer. IT-avdelingen er en naturlig samarbeidspartner i denne prosessen.
Noen institusjoner kan ha spesialtilpassete lagrings- og samhandlingssystemer som støtter og dokumenterer dataflyt gjennom hele prosjektet, fra innsamling til arkivering/publisering, mens andre kun tilbyr standardløsninger.
Hvis det ikke eksisterer allerede, kan det være nyttig å utarbeide en lagringsguide som gir informasjon til forskere om hvilke lagringsløsninger som kan brukes for ulike typer data. Her er det også viktig med god informasjon om informasjonsklassifisering, slik at forskere klassifiserer dataene sine riktig.
Hvilke lagringsverktøy som er tilgjengelige og godkjente for ulike datatyper, varierer fra institusjon til institusjon. Tabellen nedenfor gir eksempler på aktuelle verktøy, men forskere bør alltid sjekke med egen IT-avdeling hvilke løsninger som er godkjent for den aktuelle typen data.
| Navn på tjenesten | Kort om tjenesten | Hvilke datatyper og formater støttes? | Kostnader |
|---|---|---|---|
| Tjenester for sensitive data (TSD) – UiO i samarbeid med Sigma2 | Lagring og sikre tjenester for innsamling, analyse og behandling av sensitive data i et lukket miljø. Tilgjengelig for forskere ved UiO og eksterne brukere med registrert prosjekt. Krever ID-porten for registrering. | Tjenesten er godkjent for opptil sorte data (ved UiO) | Se UiOs prissider for gjeldende satser |
| Educloud Research - UiO | Prosjektorientert plattform med sikkert arbeidsmiljø, lagring, samhandlingsverktøy og HPC-ressurser (beregningsklyngen Fox). Tilgang styres per prosjekt av prosjektadministrator. Egnet for prosjekter med deltakere på tvers av institusjoner og landegrenser. | Tjenesten er godkjent for opptil røde data (ved UiO) | Se UiOs prissider for gjeldende satser |
| NIRD Data Peak – Sigma2 | Høyytelseslagring for aktive prosjektdata. Støtter HPC- og KI-arbeidsflyter, og kan skaleres opp til petabytstørrelser. | Alle vitenskapelige fagområder. Designet for store datamengder og intensive dataoperasjoner. | User contribution model – prisene avhenger av type prosjekt og mengde data |
| NIRD Data Lake – Sigma2 | Lagring for mindre aktive data med fil- og objektlagring (POSIX, NFS, S3). Kan skaleres til flere petabyte og støtter deling med samarbeidspartnere. | Alle vitenskapelige fagområder. Egnet for store datasett som ikke er i aktiv daglig bruk. | User contribution model – prisene avhenger av type prosjekt og mengde data |
| Microsoft OneDrive/SharePoint | Skylagring og samhandlingsplattform for lagring, deling og samarbeid om filer. Tilbys ofte via institusjonelle avtaler. | Egnet for grønne og gule data. Ikke egnet for sensitive personopplysninger eller andre konfidensielle data uten særskilt godkjenning fra institusjonens IT-avdeling. | Vanligvis inkludert i institusjonens Microsoft 365-avtale. |
| Google Workspace (Drive, Docs) | Skylagring og samhandlingsplattform for lagring, deling og samarbeid om filer. Tilbys ved noen institusjoner via avtale. | Egnet for grønne og gule data. Ikke egnet for sensitive personopplysninger eller andre konfidensielle data. | Vanligvis inkludert i institusjonens avtale, der denne finnes. |
Utfordringer ved aktiv lagring
I praksis er det som regel et begrenset utvalg lagringsmuligheter. Dette gjelder særlig for konfidensielle data som må sikres mot innsyn, men som samtidig skal være tilgjengelige for prosjektmedlemmer og samarbeidspartnere. Utfordringer kan også oppstå også når det er snakk om store datamengder. Ofte tilbyr institusjonene bare en begrenset mengde lagringskapasitet per prosjekt, og dersom dette er tilfellet, er det viktig å ha avklart alternative lagringsmuligheter i forkant dersom datamengdene er store. Kan institusjonen tilby større kapasitet ved behov? Koster dette ekstra? Hvilke eksterne løsninger er tilgjengelige, og hva er kostnaden for disse?
Når det er snakk om konfidensielle data, ligger utfordringen ofte i å finne løsninger som er sikre nok samtidig som de gjør det mulig å arbeide med dataene og dele dem med eventuelle samarbeidspartnere. Det kan også være en ekstra utfordring når studenter deltar i eller gjennomfører prosjekter, da de ofte kun har tilgang til privat utstyr. Hvis ikke institusjonen selv dekker behovet for sikre lagrings- og samhandlingsløsninger, må slike tjenester enten utvikles eller anskaffes, eller en må bruke eksterne tjenester. Et eksempel på en slik ekstern tjeneste er UiOs Tjenester for sensitive data (TSD), som dekker innsamling av data, analyse, behandling og lagring i sikrede omgivelser.
| Bibliotekets tilbud | Organisering og samarbeidspartnere | |
|---|---|---|
| Nivå 1 | Biblioteket er kontaktpunkt og kan vise til egne og eksterne nettressurser for informasjon og regelverk om datainnsamling Nettbasert informasjon om metadata, klassifisering av data, organisering av filer Innsamlingsguide Lagringsguide | Webredaktør/webansvarlig ved institusjonen. IT-avdeling (lagringsguide) |
| Nivå 2 | Veiledning og anbefaling av ulike verktøy til bruk i datainnsamling Opplæring i bruk av enkle verktøy (f.eks. diktafoner, nettbaserte verktøy) Veiledning om klassifisering og valg av lagrings- og samhandlingsløsninger
| IT-avdeling |
| Nivå 3 | Katalog over prosjekter og data ved institusjonen Fagspesifikk veiledning om metoder for datainnsamling (e.g., text mining, verktøy for innsamling av lyd og bilde, spørreskjema) Fagspesifikk veiledning om aktuelle lagringsmuligheter | IT-avdeling, forskningsadministrasjon |
Tekst: Open Science Toolbox. Redigert og oppdatert av Sikt med hjelp fra Claude (Anthropic)
Lisensiert med CC0