1 Data Warehousing Concepts

1 Data Warehousing Concepts

detta kapitel ger en översikt över Oracle Data warehousing implementation. Den innehåller:

  • Vad är ett datalager?
  • Data Warehouse Architectures

Observera att den här boken är avsedd som ett tillägg till standardtexter om datalagring. Denna bok fokuserar på Oracle-specifikt material och reproducerar inte i detalj material av allmän karaktär., Två standardtexter är:

  • Data Warehouse Toolkit av Ralph Kimball (John Wiley and Sons, 1996)
  • bygga Data Warehouse av William Inmon (John Wiley and Sons, 1996)

Vad är ett datalager?

ett datalager är en relationsdatabas som är utformad för fråga och analys snarare än för transaktionsbehandling. Det innehåller vanligtvis historiska data som härrör från transaktionsdata, men det kan innehålla data från andra källor., Det skiljer analys arbetsbelastning från transaktions arbetsbelastning och gör det möjligt för en organisation att konsolidera data från flera källor.

förutom en relationsdatabas innehåller en datalagermiljö en extraktion, transport, transformation och loading (ETL) – lösning, en online analytical processing (OLAP) – motor, klientanalysverktyg och andra applikationer som hanterar processen att samla in data och leverera den till affärsanvändare.,ett vanligt sätt att införa datalagring är att hänvisa till egenskaperna hos ett datalager som anges av William Inmon:

  • ämnesinriktad
  • integrerad
  • icke-flyktig
  • tidsvariant

ämnesinriktad

datalager är utformade för att hjälpa dig att analysera data. Om du till exempel vill veta mer om ditt företags försäljningsdata kan du bygga ett lager som koncentrerar sig på försäljning. Med hjälp av detta lager kan du svara på frågor som ” vem var vår bästa kund för det här objektet förra året?,”Denna förmåga att definiera ett datalager efter ämne, försäljning i detta fall, gör datalagret ämne orienterad.

integrerad

integrationen är nära relaterad till ämnesorientering. Datalager måste sätta data från olika källor i ett konsekvent format. De måste lösa sådana problem som att namnge konflikter och inkonsekvenser mellan måttenheter. När de uppnår detta sägs de vara integrerade.

Nonvolatile

Nonvolatile innebär att data inte bör ändras när de väl har skrivits in i lageret., Detta är logiskt eftersom syftet med ett lager är att göra det möjligt för dig att analysera vad som har inträffat.

tidsvariant

för att upptäcka trender i affärer behöver analytiker stora mängder data. Detta är mycket i motsats till online transaktionsbehandling (OLTP) system, där prestandakrav kräver att historiska data flyttas till ett arkiv. Ett datalagers fokus på förändring över tiden är vad som menas med termen tidsvariant.,

kontrasterande OLTP-och Datalagringsmiljöer

figur 1-1 visar viktiga skillnader mellan ett OLTP-system och ett datalager.

figur 1-1 kontrasterande OLTP-och Datalagringsmiljöer


textbeskrivning av illustrationen https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg005.gif

en stor skillnad mellan systemtyperna är att datalagren vanligtvis inte är i tredje normalform (3NF), en typ av datanormalisering som är vanlig i OLTP-miljöer.

datalager och OLTP-system har mycket olika krav., Här är några exempel på skillnader mellan typiska datalager och OLTP-system:

  • arbetsbelastning

    datalager är utformade för att tillgodose ad hoc-frågor. Du kanske inte känner till arbetsbelastningen på ditt datalager i förväg, så ett datalager bör optimeras för att fungera bra för en mängd olika möjliga frågeoperationer.

    OLTP-system stöder endast fördefinierade operationer. Dina program kan vara speciellt inställda eller utformade för att stödja endast dessa operationer.,

  • datamodifieringar

    ett datalager uppdateras regelbundet av ETL-processen (som körs varje kväll eller vecka) med hjälp av massdatamodifieringstekniker. Slutanvändarna av ett datalager uppdaterar inte datalagret direkt.

    i OLTP-system utfärdar slutanvändarna rutinmässigt enskilda datamodifieringsuttalanden till databasen. OLTP-databasen är alltid uppdaterad och återspeglar det aktuella läget för varje affärstransaktion.,

  • Schemadesign

    datalager använder ofta denormaliserade eller delvis denormaliserade scheman (t.ex. ett stjärnschema) för att optimera frågeprestanda.

    OLTP-system använder ofta helt normaliserade scheman för att optimera prestanda för uppdatering/Infoga / Ta bort och för att garantera datakonsistens.

  • typiska operationer

    en typisk datalagerfråga skannar tusentals eller miljontals rader. Till exempel, ”hitta den totala försäljningen för alla kunder förra månaden.”

    en typisk OLTP-operation öppnar bara en handfull poster. Till exempel ”hämta den aktuella beställningen för den här kunden.,”

  • historiska data

    datalager lagrar vanligtvis många månader eller år av data. Detta är till stöd för historisk analys.

    OLTP-system lagrar vanligtvis data från bara några veckor eller månader. OLTP-systemet lagrar endast historiska data som behövs för att framgångsrikt uppfylla kraven i den aktuella transaktionen.

datalager arkitekturer

datalager och deras arkitekturer varierar beroende på detaljerna i en organisations situation., Tre gemensamma arkitekturer är:

  • Data Warehouse Architecture (Basic)
  • Data Warehouse Architecture (with a Staging Area)
  • Data Warehouse Architecture (with a Staging Area and Data Marts)

Data Warehouse Architecture (Basic)

figur 1-2 visar en enkel arkitektur för ett datalager. Slutanvändare direkt tillgång till data som härrör från flera källsystem genom datalagret.,

figur 1-2 arkitektur i ett datalager


textbeskrivning av illustrationen https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg013.gif

i figur 1-2 finns metadata och rådata för ett traditionellt OLTP-system, liksom en ytterligare typ av data, sammanfattningsdata. Sammanfattningar är mycket värdefulla i datalager eftersom de i förväg beräknar långa operationer. Till exempel är en typisk data warehouse fråga att hämta något som augusti försäljning. En sammanfattning i Oracle kallas en materialiserad vy.,

Data Warehouse Architecture (med ett Mellanlagringsområde)

i figur 1-2 måste du rengöra och bearbeta dina operativa data innan du lägger den i lageret. Du kan göra detta programmatiskt, även om de flesta datalager använder ett mellanlagringsområde istället. Ett mellanlagringsområde förenklar byggsammanfattningar och allmän lagerhantering. Figur 1-3 illustrerar denna typiska arkitektur.,

figur 1-3 arkitektur i ett datalager med ett Mellanlagringsområde


textbeskrivning av illustrationen https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg015.gif

Datalagerararkitektur (med Mellanlagringsområde och Datamarts)

även om arkitekturen i Figur 1-3 är ganska vanlig, kanske du vill anpassa lagrets arkitektur för olika grupper inom din organisation. Du kan göra detta genom att lägga till data marts, som är system som är utformade för en viss bransch., Figur 1-4 illustrerar ett exempel där inköp, försäljning och varulager separeras. I det här exemplet kanske en finansanalytiker vill analysera historiska data för inköp och försäljning.

figur 1-4-arkitektur i ett datalager med Mellanlagringsområde och Datamarts


textbeskrivning av illustrationenhttps://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg064.gif


Obs:

datamarts är en viktig del av många lager, men de är inte i fokus för den här boken.,


Se även:

data Mart Suites dokumentation för ytterligare information om data marts

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *