1 Concepts d’entreposage de données

1 Concepts d’entreposage de données

Ce chapitre donne un aperçu de L’implémentation D’Oracle Data warehousing. Il comprend:

  • qu’est Ce qu’un Entrepôt de Données?
  • Data Warehouse Architectures

notez que ce livre est conçu comme un complément aux textes standard sur l’entreposage de données. Ce livre se concentre sur le matériel spécifique à Oracle et ne reproduit pas en détail le matériel de nature générale., Deux textes standard sont:

  • La Boîte à outils de L’entrepôt de données par Ralph Kimball (John Wiley and Sons, 1996)
  • construire l’entrepôt de données par William Inmon (John Wiley and Sons, 1996)

Qu’est-ce qu’un entrepôt de données?

un entrepôt de données est une base de données relationnelle conçue pour la requête et l’analyse plutôt que pour le traitement des transactions. Il contient généralement des données historiques dérivées de données de transaction, mais il peut inclure des données provenant d’autres sources., Il sépare la charge de travail d’analyse de la charge de travail de transaction et permet à une organisation de consolider les données provenant de plusieurs sources.

en plus d’une base de données relationnelle, un environnement d’entrepôt de données comprend une solution d’extraction, de transport, de transformation et de chargement (ETL), un moteur de traitement analytique en ligne (OLAP), des outils d’analyse client et d’autres applications qui gèrent le processus de collecte des données et de leur diffusion aux utilisateurs professionnels.,

Une façon courante d’introduire l’entreposage de données est de se référer aux caractéristiques d’un entrepôt de données telles qu’énoncées par William Inmon:

  • orienté objet
  • intégré
  • non volatile
  • variante temporelle

orienté objet

les entrepôts de données sont conçus pour vous aider à analyser les données. Par exemple, pour en savoir plus sur les données de vente de votre entreprise, vous pouvez créer un entrepôt qui se concentre sur les ventes. En utilisant cet entrepôt, vous pouvez répondre à des questions telles que « qui était notre meilleur client pour cet article l’année dernière?, »Cette capacité à définir un entrepôt de données par sujet, les ventes dans ce cas, rend l’entrepôt de données orienté objet.

Intégré

l’Intégration est étroitement liée à l’objet de l’orientation. Les entrepôts de données doivent mettre les données provenant de sources disparates dans un format cohérent. Ils doivent résoudre des problèmes tels que les conflits de dénomination et les incohérences entre les unités de mesure. Quand ils y parviennent, on dit qu’ils sont intégrés.

non volatile

non volatile signifie qu’une fois entrées dans l’entrepôt, les données ne doivent pas changer., C’est logique car le but d’un entrepôt est de vous permettre d’analyser ce qui s’est passé.

variante temporelle

pour découvrir les tendances commerciales, les analystes ont besoin de grandes quantités de données. Cela contraste beaucoup avec les systèmes de traitement des transactions en ligne (OLTP), où les exigences de performance exigent que les données historiques soient déplacées vers une archive. L’accent mis par un entrepôt de données sur le changement au fil du temps est ce que l’on entend par terme variante temporelle.,

contraste entre les environnements OLTP et D’entreposage de données

La Figure 1-1 illustre les principales différences entre un système OLTP et un entrepôt de données.

Figure 1-1 environnements OLTP et Data Warehousing contrastés


description textuelle de l’illustrationhttps://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg005.gif

une différence majeure entre les types de système est que les entrepôts de données ne sont généralement pas sous la troisième forme normale (3NF), un type de normalisation des données

les entrepôts de données et les systèmes OLTP ont des exigences très différentes., Voici quelques exemples de différences entre les entrepôts de données typiques et les systèmes OLTP:

  • Workload

    les entrepôts de données sont conçus pour accueillir des requêtes ad hoc. Vous ne connaissez peut-être pas la charge de travail de votre entrepôt de données à l’avance, un entrepôt de données doit donc être optimisé pour fonctionner correctement pour une grande variété d’opérations de requête possibles.

    les systèmes OLTP ne prennent en charge que les opérations prédéfinies. Vos applications peuvent être spécifiquement réglées ou conçues pour ne prendre en charge que ces opérations.,

  • modifications de données

    un entrepôt de données est mis à jour régulièrement par le processus ETL (exécuté tous les soirs ou toutes les semaines) en utilisant des techniques de modification de données en masse. Les utilisateurs finaux d’un entrepôt de données ne mettent pas directement à jour l’entrepôt de données.

    dans les systèmes OLTP, les utilisateurs finaux émettent régulièrement des instructions de modification de données individuelles à la base de données. La base de données OLTP est toujours à jour et reflète l’état actuel de chaque transaction commerciale.,

  • conception de schéma

    les entrepôts de données utilisent souvent des schémas dénormalisés ou partiellement dénormalisés (tels qu’un schéma en étoile) pour optimiser les performances des requêtes.

    les systèmes OLTP utilisent souvent des schémas entièrement normalisés pour optimiser les performances de mise à jour/insertion / suppression et pour garantir la cohérence des données.

  • opérations typiques

    une requête d’entrepôt de données typique analyse des milliers ou des millions de lignes. Par exemple, « Trouvez le total des ventes pour tous les clients le mois dernier. »

    une opération OLTP typique n’accède qu’à une poignée d’enregistrements. Par exemple, « récupérer la commande en cours pour ce client., »

  • Données historiques

    les entrepôts de données stockent généralement plusieurs mois ou années de données. C’est pour soutenir l’analyse historique.

    les systèmes OLTP stockent généralement des données de quelques semaines ou mois seulement. Le système OLTP stocke uniquement les données historiques nécessaires pour répondre aux exigences de la transaction en cours.

Architectures D’entrepôts de données

les entrepôts de données et leurs architectures varient en fonction des spécificités de la situation d’une organisation., Trois architectures communes sont:

  • architecture D’entrepôt de données (Basic)
  • architecture D’entrepôt de données (avec une zone de transit)
  • architecture D’entrepôt de données (avec une zone de transit et des magasins de données)

architecture D’entrepôt de données (Basic)

La Figure 1-2 Les utilisateurs finaux accèdent directement aux données dérivées de plusieurs systèmes sources via l’entrepôt de données.,

Figure 1-2 Architecture d’un entrepôt de données


description textuelle de l’illustrationhttps://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg013.gif

dans la Figure 1-2, les métadonnées et les données brutes d’un système OLTP traditionnel sont présentes, de même qu’un type supplémentaire de données, les données sommaires. Les résumés sont très précieux dans les entrepôts de données car ils pré-calculent à l’avance de longues opérations. Par exemple, une requête d’entrepôt de données typique consiste à récupérer quelque chose comme les ventes d’août. Un résumé dans Oracle est appelé une vue matérialisée.,

architecture D’entrepôt de données (avec une zone de transit)

dans la Figure 1-2, vous devez nettoyer et traiter vos données opérationnelles avant de les mettre dans l’entrepôt. Vous pouvez le faire par programme, bien que la plupart des entrepôts de données utilisent plutôt une zone de transit. Une zone de transit simplifie les résumés des bâtiments et la gestion générale des entrepôts. La Figure 1-3 illustre cette architecture typique.,

Figure 1-3 Architecture d’un entrepôt de données avec zone intermédiaire


description textuelle de l’illustrationhttps://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg015.gif

architecture D’entrepôt de données (avec zone intermédiaire et data Marts)

bien que L’architecture de la Figure 1-3 architecture pour différents groupes au sein de votre organisation. Vous pouvez le faire en ajoutant des data marts, qui sont des systèmes conçus pour un métier donné., La Figure 1-4 illustre un exemple où les achats, les ventes et les stocks sont séparés. Dans cet exemple, un analyste financier peut vouloir analyser des données historiques pour les achats et les ventes.

Figure 1-4 Architecture d’un entrepôt de données avec zone de transit et data Marts


description textuelle de l’illustrationhttps://docs.oracle.com/cd/B10500_01/server.920/a96520/dwhsg064.gif


Remarque:

Les data marts sont une partie importante de nombreux entrepôts, mais ils ne sont pas au centre de ce livre.,

Voir Aussi:

Data Mart Suites documentation pour plus d’informations concernant data marts

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *