Tato kapitola poskytuje přehled o implementaci Oracle Data warehousing. Obsahuje:
- co je datový sklad?
- architektury datových skladů
Všimněte si, že tato kniha je míněna jako doplněk ke standardním textům o skladování dat. Tato kniha se zaměřuje na materiál specifický pro Oracle a nereprodukuje podrobně materiál obecné povahy., Dva standardní texty jsou:
- Data Warehouse Toolkit od Ralpha Kimballa (John Wiley a Synové, 1996)
- Budování Datového Skladu William Inmon (John Wiley a Synové, 1996)
Co je to Datový Sklad?
datový sklad je relační databáze, která je určena spíše pro dotaz a analýzu než pro zpracování transakcí. Obvykle obsahuje Historická data odvozená z transakčních dat, ale může obsahovat data z jiných zdrojů., Odděluje analytickou zátěž od transakční pracovní zátěže a umožňuje organizaci konsolidovat data z několika zdrojů.
kromě relační databáze, datového skladu prostředí zahrnuje těžbu, dopravu, transformace a načítání (ETL) řešení, on-line analytické zpracování (OLAP), motor, klient analytické nástroje, a další aplikace, které řídí proces sběru dat a dodává, že pro podnikové uživatele.,
společný způsob zavedení datových skladů je odkazovat na vlastnosti datového skladu, jak je uvedeno William Inmon:
- Téma Orientované
- Integrovaný
- non-volatile
- Varianty
Předmět Orientovaný
Datové sklady jsou navrženy tak, aby vám pomohou analyzovat data. Chcete-li se například dozvědět více o prodejních údajích vaší společnosti, můžete vytvořit sklad, který se soustředí na prodej. Pomocí tohoto skladu můžete odpovědět na otázky jako “ Kdo byl v loňském roce naším nejlepším zákazníkem pro tuto položku?,“Tato schopnost definovat datový sklad podle předmětu, prodej v tomto případě činí subjekt datového skladu orientovaným.
integrace
úzce souvisí s orientací předmětu. Datové sklady musí dát data z různorodých zdrojů do konzistentního formátu. Musí vyřešit takové problémy, jako je pojmenování konfliktů a nesrovnalostí mezi měrnými jednotkami. Když toho dosáhnou, říká se, že jsou integrováni.
netěkavé
netěkavé znamená, že po vstupu do skladu by se data neměla měnit., To je logické, protože účelem skladu je umožnit vám analyzovat, co se stalo.
časová varianta
aby analytici objevili trendy v podnikání, potřebují velké množství dat. To je velmi Na rozdíl od systémů pro zpracování online transakcí (OLTP), kde požadavky na výkon vyžadují přesun historických dat do archivu. Zaměření datového skladu na změnu v čase je to, co se rozumí termínovou variantou času.,
kontrastní prostředí OLTP a datových skladů
obrázek 1-1 ilustruje klíčové rozdíly mezi systémem OLTP a datovým skladištěm.
Obrázek 1-1 Kontrastní OLTP a Datových Skladů Prostředí,
popis obrázku https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg005.gif
hlavní rozdíl mezi typy systému je, že datové sklady jsou obvykle ve třetí normální formě (3NF), typ dat, normalizace běžné v OLTP prostředí.
datové sklady a systémy OLTP mají velmi odlišné požadavky., Zde je několik příkladů rozdílů mezi typickými datovými sklady a systémy OLTP:
- Workload
datové sklady jsou navrženy tak, aby vyhovovaly ad hoc dotazům. Možná neznáte pracovní zátěž vašeho datového skladu předem, takže datový sklad by měl být optimalizován tak, aby fungoval dobře pro širokou škálu možných operací dotazu.
OLTP systémy podporují pouze předdefinované operace. Vaše aplikace mohou být speciálně vyladěny nebo navrženy tak, aby podporovaly pouze tyto operace.,
- modifikace dat
datový sklad je pravidelně aktualizován procesem ETL (běh noční nebo týdenní) pomocí technik hromadné modifikace dat. Koncoví uživatelé datového skladu přímo neaktualizují datový sklad.
v systémech OLTP koncoví uživatelé běžně vydávají do databáze jednotlivé příkazy pro úpravu dat. Databáze OLTP je vždy aktuální a odráží aktuální stav každé obchodní transakce.,
- Schéma design
Datové sklady často použít nenormalizované nebo částečně nenormalizované schémata (např. schéma hvězdy) pro optimalizaci výkonu dotazu.
OLTP systémy často používají plně normalizovaná schémata pro optimalizaci výkonu aktualizace/vložení/odstranění a pro zajištění konzistence dat.
- typické operace
typický dotaz na datový sklad skenuje tisíce nebo miliony řádků. Například “ Najděte celkový prodej pro všechny zákazníky minulý měsíc.“
typická operace OLTP přistupuje pouze k hrstce záznamů. Například “ načíst aktuální objednávku pro tohoto zákazníka.,“
- Historická data
datové sklady obvykle ukládají mnoho měsíců nebo let dat. To má podpořit historickou analýzu.
OLTP systémy obvykle ukládají data pouze z několika týdnů nebo měsíců. Systém OLTP ukládá pouze Historická data podle potřeby, aby úspěšně splnil požadavky aktuální transakce.
datové sklady
datové sklady a jejich architektury se liší v závislosti na specifikách situace organizace., Tři nejčastější architektury jsou:
- Datový Sklad Architektury (Základní)
- Datový Sklad Architektury (Staging Area)
- Datový Sklad Architektury (s Pracovní Prostor a Data Marts)
Datový Sklad Architektury (Základní)
Obrázek 1-2 ukazuje jednoduchý architektury datového skladu. Koncoví uživatelé mají přímý přístup k datům získaným z několika zdrojových systémů prostřednictvím datového skladu.,
Obrázek 1-2 Architektury Datového Skladu
popis obrázku https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg013.gif
Na Obrázku 1-2, metadata a nezpracovaná data z tradiční OLTP systém je přítomen, jako je další typ dat, shrnutí dat. Souhrny jsou v datových skladech velmi cenné, protože předem počítají dlouhé operace. Například typickým dotazem na datový sklad je načíst něco jako srpnový prodej. Shrnutí v Oracle se nazývá zhmotněný pohled.,
Architektura datového skladu (s pracovní plochou)
Na obrázku 1-2 musíte před vložením do skladu vyčistit a zpracovat provozní data. Můžete to udělat programově, i když většina datových skladů místo toho používá pracovní oblast. Pracovní oblast zjednodušuje shrnutí budov a obecné řízení skladu. Obrázek 1-3 ilustruje tuto typickou architekturu.,
Obrázek 1-3 Architektura Datového Skladu s Pracovní Oblasti
popis obrázku https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg015.gif
Datového Skladu, Architektura (s Pracovní Prostor a Data Marts)
i když architektura na Obrázku 1-3 je docela běžné, možná budete chtít přizpůsobit svůj sklad architektury pro různé skupiny v rámci vaší organizace. Můžete to udělat přidáním datových martů, které jsou systémy určené pro určitou oblast podnikání., Obrázek 1-4 ilustruje příklad, kde jsou odděleny nákup, prodej a zásoby. V tomto příkladu by finanční analytik mohl chtít analyzovat historická data pro nákupy a prodej.
Obrázek 1-4 Architektura Datového Skladu s Pracovní Prostor a Data Marts
popis obrázku https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg064.gif
Poznámka:
Data marty jsou důležitou součástí mnoha skladů, ale nejsou předmětem této knihy.,
Viz také:
data mart Suites dokumentace pro další informace týkající se datových marts