www.geus.dk > Arbejdsområder > Databanker > Danmark > Gerda > Arbejdsgruppen > Siden her

GERDA - GEofysisk Relationel DAtabase

De Nationale Geologiske Undersøgelser for Danmark og Grønland (GEUS)
GEUS logo - link til forsiden

ARBEJDSGRUPPEN



Referat af møde i Gerda-arbejdsgruppen.

Tid og sted:

Mødet blev afholdt på GEUS d. 11. juni 2004

Deltagere:

Esben Auken (EA), Aarhus Universitet,
Mikael Pedersen (MP), GEUS
Jørgen Tulstrup (JTu), GEUS
Ingelise Møller (ILM) (referent), GEUS

Afbud fra:

Flemming Effersøe, Hedeselskabet
Jens Dyrberg Nielsen, WaterTech
Uffe Nielsen, Rambøll
Verner Søndergaard, Århus Amt

Dagsorden:

  1. Opfølgning på omlægningen af databasen tidligere i år. Har vi fået det hele med?
  2. Historik på modeller
  3. Ønske om constraints (foreign key og not null) i PCGerda-databaser
  4. Indberetning af PCGerda-databaser på Interbase-format
  5. Seismik-datamodel
  6. Håndtering af "dårlige" datasæt der identificeres under tolkning
  7. Størrelser på datatyper, herunder reals anvendt i alle keys på PCGERDA
  8. SkyTEM GERDA model
  9. Evt.

ad 1. Opfølgning på omlægningen af databasen tidligere i år. Har vi fået det hele med?

Det er tidligere vedtaget, at alle standardafvigelser skal indberettes og lagres som faktorer i stedet for andele. Alle data, som er indberettet ved brug af GFS's Workbench er formodentlig indberettet som faktorer. Standardafvigelser, der er indberettet som andele, mangler at blive identificeret og omregnet til faktorer.

Vedrørende 2D modellerne, så er der nogle få modeller, som ikke er indlæst eller indlæst rigtigt. Da disse er på gammel format vil det sandsynligvis være lettest, hvis data importeres endnu en gang.

Tidligere er det vedtaget, at TemDat.RhoA skal være et beregnet felt, det mangler at blive implementeret. Det vil ske inden for kort tid.

Ved download af data er der tabeller, der undlades. P.t. vises beskrivelserne af disse tabeller ikke på GERDA's hjemmeside, hvilket er uhensigtsmæssigt og vil blive ændret.

Det blev besluttet, at man ved download skal kunne vælge default eller fuld download af dataset og model. Ved en default download er der nogle store datatabeller, der ikke medtages.

Det blev besluttet, at hjemmesidens feltbeskrivelsessider trænger til en revision, så xml-element- og -attributnavne udgår, da de ikke bliver brugt. Desuden vil det være hensigtsmæssigt, at det fremgår, hvorvidt et felt er et beregnet felt, som ikke hører med i indberetningen. P.t. kan man kun se om et felt kræves ved indberetning.

ad 3 og 7. Ønske om constraints (foreign key og not null) i PCGerda-databaser og Størrelser på datatyper, herunder reals anvendt i alle keys på PCGERDA.

EA har konstateret, at PCGERDA databaser, der uploades, er meget tunge at arbejde med, hvilket måske skyldes manglende contraints og/eller at der anvendes datatypen reals for alle nøgler. Yderligere er alle felter gemt i real*8 og ikke real*4 hvilket gør, at databaserne får næsten dobbelt størrelse af hvad der er nødvendigt. Igen giver dette yderligere load på databaserserveren og performance nedsættes. MP vil se på sagen. EA prioriterer højest, at nøglernes datatype ændres til integer.

ad 4. Indberetning af PCGerda-databaser på Interbase/Firebird-format.

MP vil overveje, hvad der skal gøres for at man vil kunne indberette data på Interbase/Firebird format.

ad 6. Håndtering af "dårlige" datasæt, der identificeres under tolkning.

Det blev besluttet at ”dårlige” datasæt her og nu indsnævres til ”dårlige” TEM-datasæt, hvor problemet er aktuelt. Det er muligt, når man arbejder med PCGERDA data i GFS's Workbench at vælge at ignorere datasæt og modeller, der er dårlige. Denne mærkning sker kun i brugerens lokale workspace og går tabt, når der laves et nyt PCGerda træk. Det vil derfor være hensigtsmæssigt at denne mærkning af ”dårlige” datasæt kan føres tilbage til GERDA databasen.

Det blev besluttet at ”dårlige” TEM data, som er identificeret efter afsluttet indberetning, skal kunne indberettes til GERDA databasen i en database med en enkelt tabel, der i GERDA relateres til TemPos-tabellen.

Tabellen IngorDat oprettes. Et datasæt mærkes som dårligt ved, at der er en post i tabellen for det givne datasæt.
 
Programmer, der udtrækker modeller og anvender disse i f.eks. fremstilling af kort eller profiler, skal kunne tjekke, om modellens tilhørende datasæt er mærket som dårligt og derfor skal ignoreres i fremstillingen af kortet eller profilet.

Tabellen IgnorDat vil indeholde følgende felter:

Dataset (intern ID for det tilhørende datasæt, som tildeles ved indlæsning)
Position
Client 
DsetIdent ( dataset identen (Dataset.ident), som ved indberetning benyttet til identifikation af det aktuelle datasæt)
Contractor
DateTime
samt Note der som eneste felt ikke er et krævet felt

'Dataset' eller 'DsetIdent'?? samt 'Position' og 'Client' vil være nøgle.

'Position' er TEM sonderingens position, som i TemPos.Position 

'Client' er den aktør, der har ønsket at få datasættet mærket. Forskellige aktører kan få deres egen mærkning af datasæt. Det betyder, at 'Client'-navnet i IgnorDat-tabellen kan være forskellig fra 'Client'-navnet i Dataset-tabellen.

'Contractor' er den aktør, som faktisk har udført identifikationen af de ”dårlige” data.

'DateTime' er tidspunktet for identifikationen af de ”dårlige” data.

'Note' er en fri tekst med en evt. kommentar til mærkningen.

IgnorDat-tabellen vil blive ignoreret ved normal PCGerda indberetning.

ad 2. Historik på modeller

Der blev diskuteret, hvorledes GERDA skal kunne håndtere, at der kan være flere modeller for det samme datasæt. Det blev besluttet at lave to systemer: et for en default-model og et for alternative tolkningsmodeller, som vil blive kaldt model-editions.

Default-modellen udtrækkes automatisk. Dernæst vil en bestemt model-edition kunne vælges, som derved overskriver defaultmodellen, hvis modellen eksisterer i den givne model-edition.

Defaultmodellen for 1D og 2D modeller mærkes på datasættene, hvor der tilføjes felterne markeret med rødt i WennPos, PacesPos, TemPos, SchluHea og MepHea:

'DefODVMod' er det samme som 'Model' i tabellerne ODVPDSeP eller ODVMoDSe
'DefODVModP' er det samme som 'MoPosition' i tabellen ODVPDSeP
'DefTDVMod' er det samme som 'Model' i tabellen TDVMoDSe

Ved indberetning angives en default model. Det vil sandsynligvis være nødvendigt at oprette et administrationsværktøj, således at man kan ændre defaultmodellen?

Alternative modeller eller udgaver af modeller, betegnes som model-editions. Der oprettes et nyt felt, Edition, i Model-tabellen og en ny tabel MEdition som knyttes til Model-tabellen. Model er knyttet til MEdition i en mange til én relation hvilket betyder at mange modeller kan være mærket med den samme Edition.

'Edition' er en identifikationsnøgle??

'Name' er en tekststreng som beskriver den specifikke model-udgave

'Type' er en standardtype, knyttet til en kodeliste? Det kan f.eks. være 2-lags, 3lags, .. minimumskotemodeller.

'EditiState' er en kode, der enten er ”new” eller ”exist”, som anvendes under indlæsningen, for at sikre at Edition er et unikt nummer. Hvis 'EditiState' er ”new” skal GERDA generere en ny unik værdi for 'Edition' og overskrive den indberettede værdi. Hvis 'EditiState' er ”exist” relateres Model.Edition til den eksisterende post i MEdition-tabellen.

'Client' er den aktør som har oprettet den specifikke model-udgave

'Date' er tidspunktet for oprettelsen

'Note' er en fri tekst med en kommentar til model-udgaven.

ad. 8 SkyTEM GERDA model.

EA har næsten en færdig datamodel for SKYTEM rådata og processerede data. EA og JTU mødes i slutningen af juli og diskuterer den endelige datamodel.

ad. 5 Seismik-datamodel.

MP viste og gennemgik datamodellen for en seismik database, der udvikles under §76-projektet. Den vil kunne komme til at danne grundlaget for en GERDA seismik datamodel.

ad. 9 Evt.

Intet

 


[Til top]   Sidst ændret: 18. december 2008 © De Nationale Geologiske Undersøgelser for Danmark og Grønland - GEUS
Øster Voldgade 10, 1350 København K - Tlf.: 38142000 - Fax: 38142050 - E-post: geus@geus.dk
Siden vedligeholdes af: Mikael Pedersen


*