1 adattárház fogalmak

1 adattárház fogalmak

Ez a fejezet áttekintést nyújt az Oracle adattárház megvalósításáról. Ez magában foglalja:

  • mi az adattárház?
  • adattárház architektúrák

vegye figyelembe, hogy ez a könyv az adattárolásra vonatkozó szabványos szövegek kiegészítéseként szolgál. Ez a könyv az Oracle-specifikus anyagokra összpontosít, és nem reprodukálja részletesen az általános jellegű anyagokat., Két standard szöveg:

  • Ralph Kimball (John Wiley and Sons, 1996)
  • az adattárház felépítése William Inmon (John Wiley and Sons, 1996)

mi az az adattárház?

az adattárház egy relációs adatbázis, amelyet a tranzakció feldolgozása helyett lekérdezésre és elemzésre terveztek. Általában tranzakciós adatokból származó történelmi adatokat tartalmaz, de más forrásokból származó adatokat is tartalmazhat., Ez elválasztja az elemzési munkaterhelést a tranzakciós munkaterheléstől, és lehetővé teszi a szervezet számára, hogy több forrásból származó adatokat konszolidáljon.

a relációs adatbázison kívül az adattárház környezet tartalmaz egy extrakciós, szállítási, átalakítási és betöltési (ETL) megoldást, egy online analitikai feldolgozási (OLAP) motort, ügyfélelemző eszközöket és más alkalmazásokat, amelyek az adatgyűjtés folyamatát kezelik, és azokat üzleti felhasználóknak szállítják.,

A közös utat bevezetésének adatok raktározás, hogy lásd a jellemzők egy adattárház meghatározott William Inmon:

  • Téma Orientált
  • Integrált
  • a nem felejtő
  • Időpont Változat

Téma Orientált

adattárházak célja, hogy segítsen adatok elemzésére. Például, ha többet szeretne megtudni a vállalat értékesítési adatairól, építhet egy raktárat, amely az értékesítésre koncentrál. Ezzel a raktárral válaszolhat olyan kérdésekre, mint például: “Ki volt a legjobb ügyfelünk erre a tételre tavaly?,”Ez a képesség, hogy meghatározza az adattárház tárgy, értékesítés ebben az esetben teszi az adattárház alá orientált.

integrált

Az integráció szorosan kapcsolódik a tárgyorientációhoz. Az adattárházaknak az eltérő forrásokból származó adatokat egységes formátumba kell helyezniük. Meg kell oldaniuk az olyan problémákat, mint a konfliktusok megnevezése és az egyes mértékegységek közötti következetlenségek. Amikor ezt elérik, azt mondják, hogy integrálódnak.

nem felejtő

nem felejtő azt jelenti, hogy miután belépett a raktárba, az adatok nem változnak., Ez logikus, mert a raktár célja, hogy lehetővé tegye a bekövetkezett események elemzését.

Időváltozat

az üzleti trendek felfedezéséhez az elemzőknek nagy mennyiségű adatra van szükségük. Ez nagyon ellentétben áll az online Tranzakciófeldolgozási (OLTP) rendszerekkel, ahol a teljesítménykövetelmények megkövetelik a történelmi adatok archívumba történő áthelyezését. Az adattárház az idő múlásával a változásra összpontosít, amit az időváltozat kifejezés jelent.,

kontrasztos OLTP és adattároló környezet

az 1-1. ábra az OLTP rendszer és az adattárház közötti alapvető különbségeket szemlélteti.

1-1 Ábra Kontrasztos OLTP Adatok a Raktározási Környezetben


Szöveges leírása az ábrán https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg005.gif

az Egyik fő különbség a rendszer, hogy adattárházak általában nem a harmadik normál forma (3NF), egy a típusú adatok normalizálás gyakori az OLTP környezetben.

az adattárházaknak és az OLTP rendszereknek nagyon eltérő követelményeik vannak., Íme néhány példa a tipikus adattárházak és az OLTP rendszerek közötti különbségekre:

  • munkaterhelés

    az adattárházakat ad hoc lekérdezések befogadására tervezték. Előfordulhat, hogy nem ismeri előre az adattárház munkaterhelését, ezért az adattárházat úgy kell optimalizálni, hogy jól teljesítsen a lehetséges lekérdezési műveletek széles skálájához.

    az OLTP rendszerek csak előre meghatározott műveleteket támogatnak. Az alkalmazások lehet, hogy kifejezetten hangolt, vagy úgy tervezték, hogy támogassa csak ezeket a műveleteket.,

  • adatmódosítások

    az adattárházat rendszeresen frissíti az ETL folyamat (éjszakai vagy heti Futtatás) ömlesztett adatmódosítási technikák alkalmazásával. Az adattárház végfelhasználói nem frissítik közvetlenül az adattárházat.

    az OLTP rendszerekben a végfelhasználók rendszeresen adnak ki egyedi adatmódosítási nyilatkozatokat az adatbázisba. Az OLTP adatbázis mindig naprakész, minden üzleti tranzakció aktuális állapotát tükrözi.,

  • séma tervezés

    az adattárházak gyakran denormalizált vagy részlegesen denormalizált sémákat (például csillag sémát) használnak a lekérdezési teljesítmény optimalizálására.

    az OLTP rendszerek gyakran teljesen normalizált sémákat használnak a frissítés/beszúrás/törlés teljesítményének optimalizálására, valamint az adatok konzisztenciájának garantálására.

  • tipikus műveletek

    egy tipikus adattárház lekérdezés több ezer vagy több millió Sort vizsgál. Például: “keresse meg az összes ügyfél teljes értékesítését a múlt hónapban.”

    egy tipikus OLTP művelet csak néhány rekordot ér el. Például: “az ügyfél aktuális rendelésének lekérése.,”

  • történelmi adatok

    az adattárházak általában több hónapos vagy éves adatokat tárolnak. Ennek célja a történelmi elemzés támogatása.

    az OLTP rendszerek általában csak néhány hét vagy hónap adatait tárolják. Az OLTP rendszer csak olyan történelmi adatokat tárol, amelyek szükségesek az aktuális tranzakció követelményeinek sikeres teljesítéséhez.

adattárház architektúrák

adattárházak és architektúráik a szervezet helyzetének sajátosságaitól függően változnak., Három közös architektúrákat:

  • adattárház Architektúra (Alapvető)
  • adattárház Architektúra (egy Felvonulási Terület)
  • adattárház Architektúra (a Felvonulási Területen, valamint az Adatok Mart)

adattárház Architektúra (Alapvető)

1-2 Ábra mutatja egy egyszerű építészet egy adattárház. A végfelhasználók közvetlenül hozzáférnek az adattárházon keresztül több forrásrendszerből származó adatokhoz.,

1-2 Ábra Építészet, egy adattárház


Szöveges leírása az ábrán https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg013.gif

Az 1-2 Ábra, a metaadatokat, a nyers adatokat egy hagyományos OLTP rendszer van jelen, mint egy kiegészítő típusú adatok, összefoglaló adatok. Az összefoglalók nagyon értékesek az adattárházakban, mert előre kiszámítják a hosszú műveleteket. Például egy tipikus adattárház lekérdezés az, hogy lekérjen valamit, mint az augusztusi értékesítés. Az Oracle összefoglalóját materializált nézetnek nevezik.,

adattárház architektúra (Átmeneti területtel)

az 1-2. ábrán meg kell tisztítania és feldolgoznia a működési adatokat, mielőtt azokat a raktárba helyezi. Ezt programozottan teheti meg, bár a legtöbb adattárház inkább átmeneti területet használ. A megállóhely egyszerűsíti az épületösszeállításokat és az Általános raktárkezelést. Az 1-3. ábra szemlélteti ezt a tipikus architektúrát.,

1-3.ábra a


Az ábra szöveges leírása https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg015.gif

adattárház architektúra (egy átmeneti terület és adat Marts)

bár az 1-3. ábrán látható architektúra meglehetősen gyakori, érdemes testreszabni a raktárát a szervezet különböző csoportjainak architektúrája. Ezt úgy teheti meg, hogy adatokat ad meg, amelyek egy adott üzletág számára tervezett rendszerek., Az 1-4. ábra egy példát mutat be, ahol a vásárlás, az értékesítés és a készletek elkülönülnek egymástól. Ebben a példában egy Pénzügyi elemző érdemes lehet elemezni a vásárlások és eladások történelmi adatait.

1-4. ábra egy átmeneti területtel rendelkező adattárház architektúrája és Adatmártások


Az illusztráció szöveges leírása https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg064.gif

Megjegyzés:

az Adatmartok sok raktár fontos részét képezik, de nem ezek a könyv középpontjában.,


Lásd még:

Data Mart Suites documentation for further information regarding data marts

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük