Datamodellering

Hvorfor?

Mængden af data er enorm, og den vokser med rekordfart. I nogle tilfælde kan man nøjes med mindre end perfekte data, men i mange tilfælde er det vigtigt, at data er korrekte og ajourførte.

Det skal helst være sådan, at hvert dataelement kun skal vedligeholdes et sted. Ellers er der risiko for inkonsistente data. Et formål med datamodellering er derfor at lagre data i en struktur, så man undgår ukontrolleret redundans.

Ved at kortlægge enterprise arkitekturen kan man opnå et samlet overblik over sine data - hvor de fødes, og hvor de bruges. Genbrug af data kan både reducere omkostninger til ajourføring og højne kvaliteten. Jo mere data bliver brugt, desto mere sandsynligt er det, at eventuelle fejl bliver opdaget.

Hvordan?

Før datamodelleringen påbegyndes, udarbejdes en begrebsmodel, således at datas semantiske betydning er veldefineret.

Herefter udarbejdes en konceptuel datamodel, hvor den overordnede struktur i data kortlægges. Eventuelt kan der udarbejdes en ArchiMate®-model, som viser, i hvilke arbejdsprocesser og/eller IT-systemer data fødes og anvendes.

Datamodellen detajleres og bliver til en logisk datamodel. Samme logiske datamodel kan resultere i forskellige fysiske datamodeller, afhængig af formålet. Skal en database anvendes til at vedligeholde data (transaktioner), vil man så vidt muligt designe den uden redundans. Skal databasen derimod primært anvendes til at distribuere data, vil man ofte netop indføre kontrolleret redundans for at give bedre svartider.

 

Konceptuel logisk datamodel Logisk datamodel

Hvad er det?

En datamodel er (som navnet siger) en model af data inden for et givent område. Der findes forskellige former for datamodeller til forskellige formål:

Konceptuel datamodel

En helt overordnet model af data, eksempelvis blot i form af entiteter og relationer. Kan sammen med en begrebsmodel være velegnet i forbindelse med udarbejdelsen af kravspecifikationer.

Logisk datamodel

En model, der viser en logisk organisering af data, velegnet til brug for lagring i en database (eller anden lagringsform). Den logiske datamodel viser, hvilke egenskaber, der registreres om de enkelte entiteter, deres datatyper og værdisæt. Desuden viser den kardinaliteten på relationerne. Den logiske datamodel kan være et UML-klassediagram.

Fysisk datamodel

En model, der viser en konkret implementering af den logiske datamodel, eksempelvis i form af databasetabeller, attributter og regler. I den fysiske datamodel kan der være indført kontrolleret redundans, fx af hensyn til performance.

Datasnitflader

Til brug for dataudveksling definerer man datasnitflader, fx i form af XML- eller JSON schema. Hvis datamodellerne er defineret i et EA-værktøj, kan man eventuelt generere datasnitfladerne ud fra datamodellerne.

Metadata

Anvendelse af data forudsætter, at man - foruden semantik og syntaks - kender kvaliteten på data. Derfor skal der udarbejdes "varedeklarationer" på data.