1 Concepte de Data Warehousing

1 Concepte de Data Warehousing

Acest capitol oferă o prezentare generală a implementării Oracle data warehousing. Acesta include:

  • ce este un depozit de date?
  • arhitecturi depozit de date

rețineți că această carte este menit ca un supliment la texte standard despre depozitare de date. Această carte se concentrează pe materiale specifice oracolului și nu reproduce în detaliu materiale de natură generală., Două texte standard sunt:

  • Depozitul De Date set de Instrumente de Ralph Kimball (John Wiley and Sons, 1996)
  • Construirea Depozitului de Date de William Inmon (John Wiley and Sons, 1996)

Ce este un Depozit de Date?

un depozit de date este o bază de date relațională, care este proiectat pentru interogare și analiză, mai degrabă decât pentru procesarea tranzacțiilor. De obicei, conține date istorice derivate din datele tranzacțiilor, dar poate include date din alte surse., Acesta separă volumul de lucru al analizei de volumul de lucru al tranzacțiilor și permite unei organizații să consolideze datele din mai multe surse.

În plus față de o bază de date relațională, un depozit de date de mediu include o extracție, transport, transformare și încărcare (ETL) soluție, o procesare analitică online (OLAP), motor, clientul instrumente de analiză, și alte aplicații care gestionează procesul de colectare a datelor și livrarea l la utilizatorii de afaceri.,

Un mod comun de introducere a datelor de depozitare este să se refere la caracteristicile unui depozit de date, stabilit de către William Inmon:

  • Subiect Orientat
  • Integrat
  • Nevolatila
  • Timp Variantă

Obiectul Orientat

depozitele de Date sunt concepute pentru a vă ajuta să analizați datele. De exemplu, pentru a afla mai multe despre datele de vânzări ale companiei dvs., puteți construi un depozit care se concentrează pe vânzări. Folosind acest depozit, puteți răspunde la întrebări precum ” Cine a fost cel mai bun client al nostru pentru acest articol anul trecut?,”Această capacitate de a defini un depozit de date în funcție de subiect, vânzări în acest caz, face ca subiectul depozitului de date să fie orientat.integrarea este strâns legată de orientarea subiectului. Depozitele de date trebuie să pună datele din surse disparate într-un format consistent. Ei trebuie să rezolve probleme precum numirea conflictelor și inconsecvențele între unitățile de măsură. Când realizează acest lucru, se spune că sunt integrate.

nevolatile

nevolatile înseamnă că, odată introduse în depozit, datele nu ar trebui să se schimbe., Acest lucru este logic, deoarece scopul unui depozit este de a vă permite să analizați ceea ce sa întâmplat.pentru a descoperi tendințele în afaceri, analiștii au nevoie de cantități mari de date. Acest lucru este foarte mult în contrast cu sistemele de procesare a tranzacțiilor online (OLTP), unde cerințele de performanță cer ca datele istorice să fie mutate într-o arhivă. Concentrarea unui depozit de date asupra schimbării în timp este ceea ce se înțelege prin termenul de variantă de timp.,

medii contrastante OLTP și Data Warehousing

figura 1-1 ilustrează diferențele cheie dintre un sistem OLTP și un depozit de date.

Figura 1-1 Contrastante OLTP și Medii de stocare a Datelor


descriere Text a imaginii https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg005.gif

O diferență majoră între tipurile de sistem este faptul că depozitele de date nu sunt de obicei în a treia formă normală (3NF), un tip de date normalizarea comune în OLTP medii.depozitele de date și sistemele OLTP au cerințe foarte diferite., Iată câteva exemple de diferențe între depozitele de date tipice și sistemele OLTP:

  • volumul de muncă

    depozitele de date sunt concepute pentru a găzdui interogări ad-hoc. Este posibil să nu cunoașteți în prealabil volumul de lucru al depozitului dvs. de date, deci un depozit de date ar trebui optimizat pentru a funcționa bine pentru o mare varietate de operații de interogare posibile.

    sistemele OLTP acceptă numai operații predefinite. Este posibil ca aplicațiile dvs. să fie reglate sau proiectate special pentru a suporta numai aceste operațiuni.,

  • modificări de date

    un depozit de date este actualizat în mod regulat prin procesul ETL (rulat pe timp de noapte sau săptămânal) folosind tehnici de modificare a datelor în vrac. Utilizatorii finali ai unui depozit de date nu actualizează direct depozitul de date.în sistemele OLTP, utilizatorii finali emit în mod obișnuit declarații individuale de modificare a datelor în baza de date. Baza de date OLTP este întotdeauna actualizată și reflectă starea actuală a fiecărei tranzacții de afaceri.,

  • Schema de proiectare

    depozite de Date folosesc adesea denormalized sau parțial denormalized scheme (cum ar fi un star schema) pentru a optimiza performanța de interogare.sistemele OLTP folosesc adesea scheme complet normalizate pentru a optimiza performanța actualizării/inserării / ștergerii și pentru a garanta coerența datelor.

  • operații tipice

    o interogare tipică a depozitului de date scanează mii sau milioane de rânduri. De exemplu, ” găsiți vânzările totale pentru toți clienții luna trecută.”

    o operație OLTP tipică accesează doar o mână de înregistrări. De exemplu, „preluați comanda curentă pentru acest client.,”

  • Date istorice

    depozitele de date stochează de obicei mai multe luni sau ani de date. Aceasta este pentru a sprijini analiza istorică.

    sistemele OLTP stochează de obicei date din doar câteva săptămâni sau luni. Sistemul OLTP stochează numai datele istorice după cum este necesar pentru a îndeplini cu succes cerințele tranzacției curente.

arhitecturile depozitului de date

depozitele de date și arhitecturile acestora variază în funcție de specificul situației unei organizații., Trei arhitecturi comune sunt:

  • Data Warehouse Architecture (Basic)
  • Data Warehouse Architecture (with a stadializare Area)
  • Data Warehouse Architecture (with a stadializare Area and Data Marts)

Data Warehouse Architecture (Basic)

figura 1-2 prezintă o arhitectură simplă pentru un depozit de date. Utilizatorii finali accesează direct datele derivate din mai multe sisteme sursă prin depozitul de date.,

Figura 1-2 Arhitectura unui Depozit de Date


descriere Text a imaginii https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg013.gif

În Figura 1-2, metadate și date brute de o tradițională sistem OLTP este prezent, ca este un alt tip de date, date sumare. Rezumatele sunt foarte valoroase în depozitele de date, deoarece pre-calculează operațiunile lungi în avans. De exemplu, o interogare tipică a depozitului de date este de a prelua ceva de genul vânzărilor din August. Un rezumat în Oracle se numește vizualizare materializată.,

Data Warehouse Architecture (cu o zonă de așteptare)

în figura 1-2, trebuie să curățați și să procesați datele operaționale înainte de a le pune în depozit. Puteți face acest lucru programatic, deși majoritatea depozitelor de date utilizează în schimb o zonă de așteptare. O zonă de așteptare simplifică rezumatele clădirilor și gestionarea generală a depozitelor. Figura 1-3 ilustrează această arhitectură tipică.,

Figura 1-3 Arhitectura unui Depozit de Date, cu o Zonă de Așteptare


descriere Text a imaginii https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg015.gif

Depozit de Date Arhitectura (cu o Zonă de Așteptare și Magazia de Date)

Deși arhitectura în Figura 1-3 este destul de comună, poate doriți pentru a personaliza depozit arhitecturii pentru diferite grupuri în cadrul organizației dumneavoastră. Puteți face acest lucru adăugând piețe de date, care sunt sisteme concepute pentru o anumită linie de afaceri., Figura 1-4 ilustrează un exemplu în care achizițiile, vânzările și stocurile sunt separate. În acest exemplu, un analist financiar ar putea dori să analizeze datele istorice pentru achiziții și vânzări.

Figura 1-4 Arhitectura unui Depozit de Date, cu o Zonă de Așteptare și Magazia de Date


descriere Text a imaginii https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg064.gif


Notă:

Data marts sunt o parte importantă a multor depozite, dar ele nu sunt în centrul de această carte.,


A se vedea, de asemenea:

documentația Data Mart Suites pentru informații suplimentare cu privire la data marts

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *