1 tietovarastoinnin Käsitteet

1 tietovarastoinnin Käsitteet

Tämä luku tarjoaa yleiskatsauksen Oracle tietovarastoinnin toteuttaminen. Se sisältää:

  • Mikä on tietovarasto?
  • Data Warehouse-Arkkitehtuurit

Huomaa, että tämä kirja on tarkoitettu täydentämään standardin tekstejä tietovarastoinnin. Kirja keskittyy Oraakkelikohtaiseen aineistoon eikä lisää yksityiskohtaisesti yleisluonteista materiaalia., Kaksi standard tekstit ovat:

  • Data Warehouse Toolkit by Ralph Kimball (John Wiley and Sons, 1996)
  • Building the Data Warehouse William Inmon (John Wiley and Sons, 1996)

Mikä on tietovarasto?

tietovarasto on relaatiotietokanta, joka on suunniteltu kyselyn ja analyysin sijaan tapahtumien käsittelyyn. Se sisältää yleensä transaktiotiedoista johdettuja historiallisia tietoja, mutta se voi sisältää muista lähteistä saatuja tietoja., Se erottaa analyysin työmäärän liiketoimien työmäärästä ja antaa organisaatiolle mahdollisuuden koota tietoja useista lähteistä.

lisäksi relationaalinen tietokanta, tietovarasto ympäristö sisältää louhinta, kuljetus -, muunto ja lataus (ETL) ratkaisu, online analytical processing (OLAP) – moottorin, asiakas analyysi työkaluja, ja muita sovelluksia, jotka hallita prosessia kerätä tietoja ja toimittaa se yrityskäyttäjille.,

– yhteinen tapa ottaa käyttöön tietojen varastointi on viitata ominaisuudet tietovarasto esitetty William Inmon:

  • Aihe Suuntautunut
  • Integroitu
  • Muut
  • Aika Variantti

Aihe Suuntautunut

tietovarastot on suunniteltu avulla voit analysoida tietoja. Lisätietoja yrityksen myyntitiedoista saa esimerkiksi rakentamalla myyntiin keskittyvän varaston. Käyttämällä tätä varastoa, voit vastata kysymyksiin, kuten ” Kuka oli paras asiakkaamme tämän kohteen viime vuonna?,”Tämä kyky määritellä tietovarasto aiheittain, myynti tässä tapauksessa, tekee tietovaraston subjekti suuntautunut.

integroitu

integraatio liittyy läheisesti subjektiseen suuntautumiseen. Tietovarastojen on saatettava eri lähteistä peräisin olevat tiedot yhdenmukaiseen muotoon. Niiden on ratkaistava sellaiset ongelmat kuin ristiriitojen nimeäminen ja epäjohdonmukaisuudet mittayksiköiden välillä. Kun ne saavuttavat tämän, niiden sanotaan olevan integroituja.

Muut

Haihtumaton tarkoittaa sitä, että kun tuli varastoon, tietoja ei saa muuttaa., Tämä on loogista, koska varaston tarkoituksena on antaa sinulle mahdollisuus analysoida tapahtunutta.

Aikamuunnos

liiketoiminnan trendien selvittämiseksi analyytikot tarvitsevat suuria määriä tietoa. Tämä on hyvin pitkälti toisin kuin OLTP-järjestelmissä (online transaction processing), joissa suorituskykyvaatimukset edellyttävät historiatietojen siirtämistä arkistoon. Tietovaraston painopiste ajan mittaan tapahtuvassa muutoksessa on termillä aikamuunnos.,

vastakohtaiset OLTP-ja Tietovarastointiympäristöt

kuva 1-1 kuvaa OLTP-järjestelmän ja tietovaraston keskeisiä eroja.

Kuva 1-1 Vastakkaisia OLTP ja tietovarastoinnin Ympäristöissä


Tekstin kuvaus kuva https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg005.gif

Yksi merkittävä ero tyyppisiä järjestelmä on, että tietovarastot eivät ole yleensä kolmas normaalimuoto (3NF), tietojen tyyppi normalisointi yleinen OLTP ympäristöissä.

tietovarastoilla ja OLTP-järjestelmillä on hyvin erilaiset vaatimukset., Tässä muutamia esimerkkejä erot välillä tyypillinen tietovarastot ja OLTP-järjestelmät:

  • Työmäärä

    tietovarastot on suunniteltu mukautumaan ad hoc-kyselyt. Et ehkä tiedä etukäteen tietovarastosi työmäärää, joten tietovarasto tulisi optimoida toimimaan hyvin monenlaisiin mahdollisiin kyselytoimintoihin.

    OLTP-järjestelmät tukevat vain ennalta määritettyjä toimintoja. Sovelluksesi voidaan erityisesti virittää tai suunnitella tukemaan vain näitä toimintoja.,

  • Tietojen muutokset

    tietovarasto päivitetään säännöllisesti ETL-prosessi (ajaa iltaisin tai viikoittain) käyttämällä irtotavarana tietojen muuttaminen tekniikoita. Tietovaraston loppukäyttäjät eivät suoraan Päivitä tietovarastoa.

    OLTP-järjestelmissä loppukäyttäjät antavat tietokantaan rutiininomaisesti yksittäisiä tietojen muokkausilmoituksia. OLTP-tietokanta on aina ajan tasalla, ja se kuvastaa kunkin liiketoimen nykytilaa.,

  • Rakenteen suunnittelu

    tietovarastot usein käyttää denormalisoida tai osittain denormalisoida rakenteita (kuten star schema) optimoida kyselyn suorituskykyä.

    OLTP-järjestelmät käyttävät usein täysin normalisoituja kaavioita optimoidakseen päivityksen/insertin / delete-suorituskyvyn ja taatakseen tietojen johdonmukaisuuden.

  • tyypilliset toiminnot

    tyypillinen tietovaraston kysely skannaa tuhansia tai miljoonia rivejä. Esimerkiksi ” Etsi kokonaismyynti kaikille asiakkaille viime kuussa.”

    tyypilliseen OLTP-operaatioon pääsee vain kourallinen levyjä. Esimerkiksi ” nouda nykyinen tilaus tälle asiakkaalle.,”

  • historialliset tiedot

    tietovarastot tallentavat tietoja yleensä useita kuukausia tai vuosia. Tämä tukee historiallista analyysiä.

    OLTP systems tallentaa tietoja yleensä vain muutamasta viikosta tai kuukaudesta. OLTP-järjestelmä tallentaa vain historiatietoja, joita tarvitaan nykyisen transaktion vaatimusten täyttämiseksi.

Data Warehouse-Arkkitehtuurit

tietovarastot ja niiden arkkitehtuurit vaihtelevat riippuen erityispiirteet organisaation tilanne., Kolme yhteiset arkkitehtuurit ovat:

  • Data Warehouse-Arkkitehtuuri (Perus)
  • Data Warehouse-Arkkitehtuuri (jossa Lavastus Alue)
  • Data Warehouse-Arkkitehtuuri (jossa Lavastus-Alueella ja Data Marts)

Data Warehouse-Arkkitehtuuri (Perus)

Kuva 1-2, osoittaa, yksinkertainen arkkitehtuuri tietovarasto. Loppukäyttäjät käyttävät suoraan useista lähdejärjestelmistä saatuja tietoja tietovaraston kautta.,

Kuva 1-2 Arkkitehtuurin tietovarasto


Tekstin kuvaus kuva https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg013.gif

Kuvassa 1-2, metadata ja raw data perinteisen OLTP-järjestelmä on läsnä, kuten on ylimääräinen tyyppi, tiedot, yhteenveto tiedot. Tiivistelmät ovat erittäin arvokkaita tietovarastoissa, koska ne ennakoivat pitkiä operaatioita etukäteen. Tyypillinen tietovarastokysely on esimerkiksi hakea jotain elokuun myyntiä. Tiivistelmää Oraclessa kutsutaan materialisoiduksi näkemykseksi.,

Data Warehouse-Arkkitehtuuri (jossa Lavastus Alue)

Kuvassa 1-2, sinun täytyy puhdistaa ja käsitellä operatiivisia tietoja, ennen kuin laitat sen varastoon. Voit tehdä tämän ohjelmallisesti, vaikka useimmat tietovarastot käyttää kerääntymisalue sijaan. Pysähdysalue yksinkertaistaa rakennusselvityksiä ja yleistä varastonhallintaa. Kuva 1-3 havainnollistaa tätä tyypillistä arkkitehtuuria.,

Kuva 1-3 Arkkitehtuurin tietovarasto, jossa Lavastus Alue


Tekstin kuvaus kuva https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg015.gif

Data Warehouse-Arkkitehtuuri (jossa Lavastus-Alueella ja Data Marts)

Vaikka arkkitehtuuri Kuvassa 1-3 on melko yleinen, voit halutessasi muokata varaston arkkitehtuuri eri ryhmät organisaation sisällä. Voit tehdä tämän lisäämällä datamartteja, jotka ovat järjestelmiä, jotka on suunniteltu tietylle toimialalle., Kuvio 1-4 kuvaa esimerkkiä, jossa Osto -, myynti-ja vaihto-omaisuuserät erotetaan toisistaan. Tässä esimerkissä talousanalyytikko voisi haluta analysoida historiallisia tietoja ostoista ja myynnistä.

Kuva 1-4 Arkkitehtuurin tietovarasto, jossa Lavastus-Alueella ja Data Marts


Tekstin kuvaus kuva https://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg064.gif


Note:

Data marts ovat tärkeä osa monissa varastoissa, mutta ne eivät ole keskittyä tämän kirjan.,


Katso Myös:

Data Mart Suites asiakirjat lisätietoja data marts

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *