1 Data Warehousingarehousing Concepts

1 Data Warehousingarehousing Concepts

dette kapitel giver et overblik over Oracle data dataarehousing implementering. Det omfatter:

  • hvad er et data Warehousearehouse?
  • data Architecarehouse-arkitekturer

Bemærk, at denne bog er ment som et supplement til standardtekster om datalagring. Denne bog fokuserer på Oracle-specifikt materiale og gengiver ikke detaljeret materiale af generel karakter., To standardtekster er:

  • data Warehousearehouse Toolkit af Ralph Kimball (John andiley and Sons, 1996)
  • opbygning af Data Warehousearehouse af Williamilliam Inmon (John ?iley and Sons, 1996)

Hvad er et data Warehousearehouse?

et datavarehus er en relationsdatabase, der er designet til forespørgsel og analyse snarere end til transaktionsbehandling. Det indeholder normalt Historiske data afledt af transaktionsdata, men det kan indeholde data fra andre kilder., Det adskiller analysebelastning fra transaktionsbelastning og gør det muligt for en organisation at konsolidere data fra flere kilder.

ud over en relationsdatabase inkluderer et data warehousearehouse-miljø en ekstraktion, transport, transformation og indlæsning (ETL) – løsning, en online analytisk behandling (OLAP) – motor, klientanalyseværktøjer og andre applikationer, der administrerer processen med at indsamle data og levere dem til forretningsbrugere.,

En fælles måde at indføre data warehousing, er at henvise til egenskaber i et data warehouse, som er fremsat af William Inmon:

  • Emne Orienteret
  • Integreret
  • ikke-Flygtig
  • Tid Variant

Emne Orienteret

Data warehouses er designet til at hjælpe dig med at analysere data. For eksempel, for at lære mere om din virksomheds salgsdata, kan du bygge et lager, der koncentrerer sig om salg. Ved hjælp af dette lager kan du besvare spørgsmål som “hvem var vores bedste kunde til denne vare sidste år?,”Denne evne til at definere et datavarehus efter emne, salg i dette tilfælde, gør datavarehuset emneorienteret.

integreret

Integration er tæt knyttet til emneorientering. Data warehousesarehouses skal sætte data fra forskellige kilder i et ensartet format. De skal løse sådanne problemer som navngivning af konflikter og uoverensstemmelser mellem måleenheder. Når de opnår dette, siges de at være integreret.

ikke-flygtig

ikke-flygtig betyder, at data, når de først er indgået i lageret, ikke bør ændres., Dette er logisk, fordi formålet med et lager er at gøre det muligt for dig at analysere, hvad der er sket.

Tidsvariant

for at opdage tendenser i erhvervslivet har analytikere brug for store mængder data. Dette er i høj grad i modsætning til online transaction processing (OLTP) systemer, hvor præstationskrav kræver, at Historiske data flyttes til et arkiv. Et data warehousearehouses fokus på forandring over tid er, hvad der menes med udtrykket tidsvariant.,

kontrasterende OLTP-og Datalagringsmiljøer

figur 1-1 illustrerer vigtige forskelle mellem et OLTP-system og et datalager.

figur 1-1 kontrasterende OLTP-og Datalagringsmiljøer


tekstbeskrivelse af illustrationenhttps://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg005.gif

en væsentlig forskel mellem systemtyperne er, at datalagre normalt ikke er i tredje normale form (3NF), en type datanormalisering, der er almindelig i OLTP-miljøer.

datalagre og OLTP-systemer har meget forskellige krav., Her er nogle eksempler på forskelle mellem typiske datalagre og OLTP-systemer:

  • arbejdsbyrde

    datalagre er designet til at rumme ad hoc-forespørgsler. Du kender muligvis ikke arbejdsbyrden på dit datavarehus på forhånd, så et datavarehus skal optimeres, så det fungerer godt til en lang række mulige forespørgselsoperationer.OLTP-systemer understøtter kun foruddefinerede operationer. Dine applikationer er muligvis specifikt indstillet eller designet til kun at understøtte disse operationer.,

  • dataændringer

    et data warehousearehouse opdateres regelmæssigt ved hjælp af ETL-processen (Kør natligt eller ugentligt) ved hjælp af bulkdatamodifikationsteknikker. Slutbrugerne af et data warehousearehouse opdaterer ikke data warehousearehouse direkte.

    i OLTP-systemer udsender slutbrugere rutinemæssigt individuelle dataændringserklæringer til databasen. OLTP-databasen er altid opdateret og afspejler den aktuelle tilstand for hver forretningstransaktion.,

  • Schema design

    data warehousesarehouses bruger ofte denormaliserede eller delvist denormaliserede skemaer (såsom et stjerneskema) for at optimere forespørgselsydelsen.OLTP-systemer bruger ofte fuldt normaliserede skemaer til at optimere opdatering/Indsæt/Slet ydeevne og for at garantere datakonsistens.

  • typiske operationer

    en typisk Data queryarehouse forespørgsel scanner tusindvis eller millioner af rækker. For eksempel “Find det samlede salg for alle kunder i sidste måned.”

    en typisk OLTP-operation får kun adgang til en håndfuld poster. For eksempel “Hent den aktuelle ordre til denne kunde.,”

  • Historiske data

    datalagre gemmer normalt mange måneder eller år med data. Dette er for at understøtte historisk analyse.OLTP-systemer gemmer normalt data fra kun få uger eller måneder. OLTP-systemet gemmer kun Historiske data efter behov for at kunne opfylde kravene i den aktuelle transaktion.

data Warehousearehouse arkitekturer

data warehousesarehouses og deres arkitekturer varierer afhængigt af specifikationerne i en organisations situation., Tre almindelige arkitekturer er:

  • data Dataarehouse Architecture (Basic)
  • data Dataarehouse Architecture (med et Iscenesættelsesområde)
  • data Dataarehouse Architecture (med et Iscenesættelsesområde og data Marts)

data .arehouse Architecture (Basic)

figur 1-2 viser en simpel arkitektur for et data .arehouse. Slutbrugere får direkte adgang til data, der stammer fra flere kildesystemer gennem data warehousearehouse.,

figur 1-2 arkitektur i et data Warehousearehouse


tekstbeskrivelse af illustrationen https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg013.gif

i figur 1-2 er metadata og rå data fra et traditionelt OLTP-system til stede, ligesom en yderligere type data, summariske data. Resum .er er meget værdifulde i data warehousesarehouses, fordi de forudberegner lange operationer på forhånd. For eksempel er en typisk Data queryarehouse forespørgsel at hente noget som August salg. Et resum.i Oracle kaldes en materialiseret visning.,

data Warehousearehouse-arkitektur (med et Iscenesættelsesområde)

i figur 1-2 skal du rengøre og behandle dine operationelle data, før du sætter dem i lageret. Du kan gøre dette programmatisk, selvom de fleste data warehousesarehouses bruger et iscenesættelsesområde i stedet. En iscenesættelse område forenkler bygning resum .er og generel lagerstyring. Figur 1-3 illustrerer denne typiske arkitektur.,

figur 1-3 arkitektur af et data Warehousearehouse med en mellemstation område


tekst beskrivelse af illustrationen https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg015.gif

data Dataarehouse arkitektur (med en mellemstation område og data Marts)

selvom arkitekturen i figur 1-3 er ganske almindelig, kan du tilpasse dit lager arkitektur til forskellige grupper inden for din organisation. Du kan gøre dette ved at tilføje datamarkeder, som er systemer designet til en bestemt forretningsområde., Figur 1-4 illustrerer et eksempel, hvor indkøb, salg og varebeholdninger adskilles. I dette eksempel vil en finansanalytiker måske analysere Historiske data for køb og salg.

figur 1-4 arkitektur af et data Warehousearehouse med et Iscenesættelsesområde og data Marts


tekst beskrivelse af illustrationenhttps://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg064.gif


Bemærk:

data marts er en vigtig del af mange lagre, men de er ikke i fokus i denne bog.,


Se også:

data Mart Suites dokumentation for yderligere information vedrørende data marts

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *