Datakilder i DUCT

Datakilder i DUCT er for det meste tematiserte utvalg fra cristin-databasen. En datakilde består av flere koblede tabeller fra cristin-databasen og det er gjort et utvalg av relevante variabler fra disse tabeller. I de fleste tilfeller er det lagt til enkle ferdige beregninger eller forenklende dimensjoner. Datakilder i DUCT er i all hovedsak”current”, de har status her-og-nå og blir oppdatert en gang om dagen, ca. kl 7.00 om morgen. Med mindre annet er angitt er datakilden en ”current”-kilde.

Det vil i tillegg finnes minst todatakilder som ikke er koblet til cristin-databasen, men tar utgangspunkt i data, slik de ble rapportert under NVI-rapportering av gjeldende år. Slike datakilder vil altså ha status der-og-da og blir dermed kun oppdatert en gang i året etter hver NVI-rapportering. Datakildene som har status der-og-da og arbeidsbøkene som er basert på dem vil ha navn som inneholder ”statisk” eller ”på rapporteringstidspunktet”

Forskjeller og likheter på de to typer datakilder

Datakildene med status”der-og-da” er satt sammen i ettertid (på våren 2017 for årene tilbake til 2011) av en rekke statiske filer. Mye informasjon fra rapporteringstidspunktet er bevart, men ikke absolutt alt, som for eksempel hele institusjonens stedhierarki. Det er kun enheter som ble kreditert, samt et tilnærmet komplett 1.undernivå på institusjonen som foreligger. ”Der-og-da”-kilder viser bildet før eventuelle fusjoner av institusjoner. ”Der-og-da”-kilder er for øvrig nøyaktig på antall publikasjoner og publikasjonspoeng og er dermed et sted for oppslag om NVI-rapportering.

”Her-og-nå”-kilder gir mulighet til å følge utviklingen på inneværende år med daglige oppdateringer. ”Her-og-nå”-kilder viser institusjoner, slik de framstår nå, altså bildet etter eventuelle fusjoner av institusjoner. Dette berører ikke bare institusjonene som er en del av en fusjon eller overtakelse, men alle som har samarbeidet med disse institusjoner.”Her-og-nå”-kilder vil ha avvik på antall publikasjoner og publikasjonspoeng fra rapporteringstidspunktet, i større grad, dersom fusjonerte institusjoner er involvert, i mindre grad, i sammenheng med menneskelige feil, som er rettet i etterkant for å tilfredsstille cristin-systemets rolle som et register over vitenskapelige publikasjoner.I tillegg til data for NVI-rapportering inneholder ”her-og-nå”-datakilder informasjon om alle registrerte publikasjoner i Cristin. Dette er per 1.1.2017 over 1,3 millioner (NVI-publikasjoner mellom 2011 og 2016 utgjør ca. en tiendedel av dette). Videre finnes datakilder som omhandler finansiering, open access m.m.

Publisert 19. mars 2020 09:51 - Sist endret 19. mars 2020 09:51