Institusjonelle dataarkiv
Et åpent tverrfaglig institusjonsarkiv er et godt alternativ til fagspesifikke arkiv og andre arkiv som dekker helt særskilte behov, slik som løsninger for sensitive data. I denne artikkelen presenteres de to mest aktuelle institusjonsarkivene for den norske UH-sektoren. Det finnes en rekke tverrfaglige arkiv som alle kan benytte seg av, også uavhengige forskere, men det kan være hensiktsmessig at institusjonen har et eget institusjonsarkiv for sine forskere. Et institusjonsarkiv kan legge til rette for god forvaltning og kuratering av datasett, som ikke er avhengig av enkeltforskere.
I tabellen under er det gjort et forsøk på å oppsummere og sammenligne viktige funksjoner i de to mest aktuelle løsningene for forskere i Norge; DataverseNO og Figshare.
| Figshare | DataverseNO | |
| Åpen kilde | Nei | Ja |
| Kostnadsmodell | Kommersiell tjeneste - prisen er institusjonsavhengig | Partnerinstitusjoner betaler en årlig kostnad som inkluderer opplæring, kuratering, og brukerstøtte. Forskere fra andre norske institusjoner kan benytte arkivet gratis |
| Lisenser | CC0 (public domain) for datasett, evt. CC BY for andre objekter (publikasjoner) | CC0 er standard. Ved behov for eller ønske om å bruke en annen lisens, ta kontakt med støttetjenesten |
| Egnet for sensitive data | Ja, men ikke anbefalt | Nei, men støtter begrenset adgang |
| Versjonskontroll | Ja | Ja |
| Størrelse på fil/datasett | Vanlig grense er 5GB per fil. Institusjonskontoer har egne grenser, og en kan laste opp større filer, men maks. filstørrelse er 5TB | Enkeltfiler bør ikke overstige 100 GB. En enkelt opplasting bør ikke overstige 200 GB totalt. DataverseNO har ingen øvre grense for størrelsen på et datasett, men ta kontakt med støttetjenesten ved behov for store opplastinger |
| Kan lenke fra datasett til artikkel | Ja | Ja |
| Virusskanning | Nei | Nei |
| Langtidsarkivering/ mellomlagring | Begge deler | Begge deler (men målet er å publisere) |
| DOI (persistent identifikator) på datasett | Ja | Ja |
| Indeksert i søkemotor for datasett | Ja, alle store, inkl. BASE, Google dataset search | Ja, alle store, inkl. BASE, Google dataset search |
| Kontrollert vokabular | Australian and New Zealand Standard Research Classification | Dataverse custom vocabulary |
| Liste over foretrukne filtyper | Ja (alle filtyper) | Ja (alle filtyper). Zip-filer pakkes ut automatisk |
| Sertifisering | ISO27001-sertifisert. ISO27001 er en standard for styringssystemer for informasjonssikkerhet | CoreTrustSeal. CTS stiller også krav til selve dataene |
| Andre kommentarer | UiT administrerer for andre universitet, på server i Norge. De tilbyr en tjeneste som inkluderer opplæring og drift |
I tillegg til institusjonelle løsninger finnes det nasjonale arkiv som forskere kan benytte direkte, som Sikts forskningsdataarkiv (særlig for samfunnsvitenskap og humaniora) og NIRD Research Data Archive (særlig for store datasett). Se informasjonsartikkelen Arkivering og publisering av data for en bredere oversikt.
Tekst: Open Science Toolbox. Redigert og oppdatert av Sikt med hjelp fra Claude (Anthropic)
Lisensiert med CC0