Ez a fejezet áttekintést nyújt az Oracle adattárház megvalósításáról. Ez magában foglalja:
- mi az adattárház?
- adattárház architektúrák
vegye figyelembe, hogy ez a könyv az adattárolásra vonatkozó szabványos szövegek kiegészítéseként szolgál. Ez a könyv az Oracle-specifikus anyagokra összpontosít, és nem reprodukálja részletesen az általános jellegű anyagokat., Két standard szöveg:
- Ralph Kimball (John Wiley and Sons, 1996)
- az adattárház felépítése William Inmon (John Wiley and Sons, 1996)
mi az az adattárház?
az adattárház egy relációs adatbázis, amelyet a tranzakció feldolgozása helyett lekérdezésre és elemzésre terveztek. Általában tranzakciós adatokból származó történelmi adatokat tartalmaz, de más forrásokból származó adatokat is tartalmazhat., Ez elválasztja az elemzési munkaterhelést a tranzakciós munkaterheléstől, és lehetővé teszi a szervezet számára, hogy több forrásból származó adatokat konszolidáljon.
a relációs adatbázison kívül az adattárház környezet tartalmaz egy extrakciós, szállítási, átalakítási és betöltési (ETL) megoldást, egy online analitikai feldolgozási (OLAP) motort, ügyfélelemző eszközöket és más alkalmazásokat, amelyek az adatgyűjtés folyamatát kezelik, és azokat üzleti felhasználóknak szállítják.,
A közös utat bevezetésének adatok raktározás, hogy lásd a jellemzők egy adattárház meghatározott William Inmon:
- Téma Orientált
- Integrált
- a nem felejtő
- Időpont Változat
Téma Orientált
adattárházak célja, hogy segítsen adatok elemzésére. Például, ha többet szeretne megtudni a vállalat értékesítési adatairól, építhet egy raktárat, amely az értékesítésre koncentrál. Ezzel a raktárral válaszolhat olyan kérdésekre, mint például: “Ki volt a legjobb ügyfelünk erre a tételre tavaly?,”Ez a képesség, hogy meghatározza az adattárház tárgy, értékesítés ebben az esetben teszi az adattárház alá orientált.
integrált
Az integráció szorosan kapcsolódik a tárgyorientációhoz. Az adattárházaknak az eltérő forrásokból származó adatokat egységes formátumba kell helyezniük. Meg kell oldaniuk az olyan problémákat, mint a konfliktusok megnevezése és az egyes mértékegységek közötti következetlenségek. Amikor ezt elérik, azt mondják, hogy integrálódnak.
nem felejtő
nem felejtő azt jelenti, hogy miután belépett a raktárba, az adatok nem változnak., Ez logikus, mert a raktár célja, hogy lehetővé tegye a bekövetkezett események elemzését.
Időváltozat
az üzleti trendek felfedezéséhez az elemzőknek nagy mennyiségű adatra van szükségük. Ez nagyon ellentétben áll az online Tranzakciófeldolgozási (OLTP) rendszerekkel, ahol a teljesítménykövetelmények megkövetelik a történelmi adatok archívumba történő áthelyezését. Az adattárház az idő múlásával a változásra összpontosít, amit az időváltozat kifejezés jelent.,
kontrasztos OLTP és adattároló környezet
az 1-1. ábra az OLTP rendszer és az adattárház közötti alapvető különbségeket szemlélteti.
1-1 Ábra Kontrasztos OLTP Adatok a Raktározási Környezetben
Szöveges leírása az ábrán https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg005.gif
az Egyik fő különbség a rendszer, hogy adattárházak általában nem a harmadik normál forma (3NF), egy a típusú adatok normalizálás gyakori az OLTP környezetben.
az adattárházaknak és az OLTP rendszereknek nagyon eltérő követelményeik vannak., Íme néhány példa a tipikus adattárházak és az OLTP rendszerek közötti különbségekre:
- munkaterhelés
az adattárházakat ad hoc lekérdezések befogadására tervezték. Előfordulhat, hogy nem ismeri előre az adattárház munkaterhelését, ezért az adattárházat úgy kell optimalizálni, hogy jól teljesítsen a lehetséges lekérdezési műveletek széles skálájához.
az OLTP rendszerek csak előre meghatározott műveleteket támogatnak. Az alkalmazások lehet, hogy kifejezetten hangolt, vagy úgy tervezték, hogy támogassa csak ezeket a műveleteket.,
- adatmódosítások
az adattárházat rendszeresen frissíti az ETL folyamat (éjszakai vagy heti Futtatás) ömlesztett adatmódosítási technikák alkalmazásával. Az adattárház végfelhasználói nem frissítik közvetlenül az adattárházat.
az OLTP rendszerekben a végfelhasználók rendszeresen adnak ki egyedi adatmódosítási nyilatkozatokat az adatbázisba. Az OLTP adatbázis mindig naprakész, minden üzleti tranzakció aktuális állapotát tükrözi.,
- séma tervezés
az adattárházak gyakran denormalizált vagy részlegesen denormalizált sémákat (például csillag sémát) használnak a lekérdezési teljesítmény optimalizálására.
az OLTP rendszerek gyakran teljesen normalizált sémákat használnak a frissítés/beszúrás/törlés teljesítményének optimalizálására, valamint az adatok konzisztenciájának garantálására.
- tipikus műveletek
egy tipikus adattárház lekérdezés több ezer vagy több millió Sort vizsgál. Például: “keresse meg az összes ügyfél teljes értékesítését a múlt hónapban.”
egy tipikus OLTP művelet csak néhány rekordot ér el. Például: “az ügyfél aktuális rendelésének lekérése.,”
- történelmi adatok
az adattárházak általában több hónapos vagy éves adatokat tárolnak. Ennek célja a történelmi elemzés támogatása.
az OLTP rendszerek általában csak néhány hét vagy hónap adatait tárolják. Az OLTP rendszer csak olyan történelmi adatokat tárol, amelyek szükségesek az aktuális tranzakció követelményeinek sikeres teljesítéséhez.
adattárház architektúrák
adattárházak és architektúráik a szervezet helyzetének sajátosságaitól függően változnak., Három közös architektúrákat:
- adattárház Architektúra (Alapvető)
- adattárház Architektúra (egy Felvonulási Terület)
- adattárház Architektúra (a Felvonulási Területen, valamint az Adatok Mart)
adattárház Architektúra (Alapvető)
1-2 Ábra mutatja egy egyszerű építészet egy adattárház. A végfelhasználók közvetlenül hozzáférnek az adattárházon keresztül több forrásrendszerből származó adatokhoz.,
1-2 Ábra Építészet, egy adattárház
Szöveges leírása az ábrán https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg013.gif
Az 1-2 Ábra, a metaadatokat, a nyers adatokat egy hagyományos OLTP rendszer van jelen, mint egy kiegészítő típusú adatok, összefoglaló adatok. Az összefoglalók nagyon értékesek az adattárházakban, mert előre kiszámítják a hosszú műveleteket. Például egy tipikus adattárház lekérdezés az, hogy lekérjen valamit, mint az augusztusi értékesítés. Az Oracle összefoglalóját materializált nézetnek nevezik.,
adattárház architektúra (Átmeneti területtel)
az 1-2. ábrán meg kell tisztítania és feldolgoznia a működési adatokat, mielőtt azokat a raktárba helyezi. Ezt programozottan teheti meg, bár a legtöbb adattárház inkább átmeneti területet használ. A megállóhely egyszerűsíti az épületösszeállításokat és az Általános raktárkezelést. Az 1-3. ábra szemlélteti ezt a tipikus architektúrát.,
1-3.ábra a
Az ábra szöveges leírása https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg015.gif
adattárház architektúra (egy átmeneti terület és adat Marts)
bár az 1-3. ábrán látható architektúra meglehetősen gyakori, érdemes testreszabni a raktárát a szervezet különböző csoportjainak architektúrája. Ezt úgy teheti meg, hogy adatokat ad meg, amelyek egy adott üzletág számára tervezett rendszerek., Az 1-4. ábra egy példát mutat be, ahol a vásárlás, az értékesítés és a készletek elkülönülnek egymástól. Ebben a példában egy Pénzügyi elemző érdemes lehet elemezni a vásárlások és eladások történelmi adatait.
1-4. ábra egy átmeneti területtel rendelkező adattárház architektúrája és Adatmártások
Az illusztráció szöveges leírása https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg064.gif
Megjegyzés:
az Adatmartok sok raktár fontos részét képezik, de nem ezek a könyv középpontjában.,
Lásd még:
Data Mart Suites documentation for further information regarding data marts