7  Datavarehus

Alle datakildene som benyttes av lønn- og sysselsettingsstatistikkene lastes inn og tilrettelegges i et datavarehus (DVH). Løsningen er bygget rundt en felles Enterprise Data Varehusmodell for mikrodata.

Kildene til datavarehuset vil være reviderte statistikk-klare data. Datakildene lastes inn på lavest mulig detaljeringsnivå og de skal være integrerte, dvs. koblet sammen. Noen av kildene er forløpsorganisert (f.eks. NUDB, VoF, FREG og Matrikkelen). Det innebærer en hendelsesorientert lagring av data. Dersom en variabel endrer seg, lages det en ny rad med dato. På den måten kan situasjonen på hvilket som helst tidspunkt gjenskapes. Andre kilder i datavarehuset vil være organisert som tverrsnitt (f.eks. data fra a-meldingen).

I DVH er alle kildene lagret i ulike tabeller som er koblet sammen.

Det må gjøres noe kvalitetsforbedrende tiltak for å kunne koble kildene sammen i datavarehuset. Det gjelder f.eks. dubletter, ugyldige identifikatorer eller annen inkonsistens som gjør at man ikke kan koble med andre kilder i datavarehuset.

Kilder som lastes inn i datavarehuset:

Kilder sammenkoblet i DVH:

Datakildene er beskrevet i kapittel 3.