Comment l’innovation transforme l’intégration des données en 2023 ?

Pour citer ce mémoire et accéder à toutes ses pages
🏫 Université de 8 Mai 1945 – Guelma - Faculté des Mathématiques d'Informatique et des Sciences de la matière - Département d'Informatique
📅 Mémoire de fin de cycle en vue de l'obtention du diplôme de Master - 2022
🎓 Auteur·trice·s
BOUCENA Lilia
BOUCENA Lilia

L’innovation dans l’intégration des données transforme radicalement la gestion des données massives. En dévoilant une architecture ETL améliorée, cette recherche offre des solutions concrètes aux défis d’hétérogénéité et de volume, avec des implications significatives pour l’efficacité des processus métiers.


Les Entrepôts de données ou Data warehouse

Les entrepôts de données ont prouvé leur importance dans de nombreux de projets d’intégration et en informatique décisionnelle ou business intelligence. En effet, l’entrepôt de données est une architecture pouvant servir de base à des applications décisionnelles. De manière très simple, on peut voir une entrepôt de données comme une base de données multidimensionnelle.

C’est à dire qu’elle prend en compte plusieurs dimensions ou axes de données. Les données qui alimente l’entrepôt de données sont collectées à partir de diverses sources afin de créer un référentiel d’informations communs à l’ensemble des sources. Les données peuvent être extraites des sources de production, ou systèmes d’information opérationnels, comme elles peuvent parvenir de sources externes à l’entreprise.

Ces données sont récupérées de manière instantanée ou périodiquement. Pour être utilisables, toutes les données des systèmes distribués doivent être organisées, coordonnées, intégrées et finalement stockées pour fournir aux utilisateurs une vue globale de l’information.

En résumé, on peut percevoir un entrepôt de données comme une base de données relationnelle conçue pour l’interrogation et l’analyse de données, la prise de décision et les activités de type informatique décisionnelle, plutôt que de traiter des transactions ou d’autres utilisations traditionnelles des bases de données [36].

Illustration de l’usage des Entrepôts de données

Dans le domaine de la santé, les entrepôts de données, comme référentiels centraux, sont utilisés pour enregistrer les informations sur les patients des différentes unités de l’organisation médicale. Cela inclurait les informations personnelles des patients, les transactions financières avec l’hôpital et les données d’assurance, les dossiers de laboratoires, de consultation et les opérations effectuées sur les malades et ainsi de suite.

Comme illustré dans la figure 2.7, toutes ces données sont consolidées dans l’entrepôt de données et connecté via le schéma de la base de données.

[8_solutions-innovantes-pour-integration-des-donnees-en-2023_15]

Source: Figure 2.7 – Exemple d’entrepôt de données

Architecture des entrepôts de données

Une architecture d’entrepôt de données définit la disposition des données dans les différentes bases de données. Étant donné que les données doivent être organisées et nettoyées pour être utiles, alors il existe trois types de modèles différents à prendre en compte pour construire des couches d’entrepôt de données [37]. Ces trois modèles sont exposés dans ce qui suit.

Architecture à un niveau

Le but d’un niveau unique est de minimiser la quantité de données stockées. L’objectif est d’éliminer la redondance des données. Cette architecture est rarement utilisée en pratique et elle a prouvé ses limites pour des entreprises ayant des données complexes et avec plusieurs flux de données.

Architecture à deux niveaux

La structure d’un modèle d’entrepôt de données à deux niveaux consiste à séparer les sources physiquement disponibles et l’entrepôt de données. Cette architecture n’est pas évolutive et ne prend pas en charge un grand nombre d’utilisateurs finaux.

De plus, cette configuration engendre des problèmes de connectivité en raison des limitations du réseau. La conception à deux niveaux utilise, à la fois, des serveurs système et de base de données. Les petites organisations qui utilisent des serveurs pour le stockage de données utilisent généralement une architecture à deux niveaux.

Bien qu’elle soit plus efficace pour stocker et organiser les données, la structure à deux niveaux n’est pas évolutive. De plus, elle ne prend en charge qu’un nombre nominal d’utilisateurs.

Architecture d’entrepôt de données à trois niveaux

C’est l’architecture d’entrepôt de données la plus largement utilisée dans les organisations. Elle offre l’avantage de gérer des flux de données bien organisés, en partant des informations brutes contenues dans les sources aux informations cibles de l’entrepôt. Elle se compose de trois couches suivantes : supérieure, intermédiaire et inférieure, que nous allons détaillé par la suite.

  • Niveau inférieur : la base de données du serveur (Datawarehouse) agit comme un niveau inférieur. Il s’agit généralement d’un système de base de données relationnelle qui stocke les données sont nettoyées, transformées et chargées à l’aide d’outils back-end.
  • Niveau intermédiaire : appelé l’entrepôt de données axé sur OLAP. C’est un serveur OLAP implémenté à l’aide du modèle ROLAP (Relational OLAP) ou MOLAP (Multidimentional OLAP). Pour l’utilisateur, une application à ce niveau présente une vue abstraite de la base de données. Cette couche sert également d’intermédiaire entre l’utilisateur final et la base de données, car elle inclut un serveur OLAP pré- construit dans l’architecture.
  • Niveau supérieur : C’est le niveau client qui comprend les outils et l’interface de programmation d’application (API) ou couche client frontale. Ce niveau assure les fonctions qui utilisent l’analyse de données de haut niveau, les enquêtes et les rapports. Il peut contenir des outils de requêtes ou de création de rapports, des outils d’analyse et des outils d’exploration de données.

La figure 2.8, illustre plus en détail les trois niveaux d’un entrepôt de données par le diagramme d’entrepôt de données, qui sont les différents types d’architecture d’entrepôt de données traditionnelle.

[8_solutions-innovantes-pour-integration-des-donnees-en-2023_16]

Source: Figure 2.8 – Les trois niveaux d’un entrepôt de données d’après [1]

Fonctionnement des entrepôts de données

Un entrepôt de données fonctionne comme un référentiel central des données. Les informations proviennent d’une ou plusieurs sources de données, telles que des systèmes transactionnels ou d’autres bases de données relationnelles. Les données peuvent être de différents format, tels que les données structurées, semi-structurées ou non structurées.

Une fois ingérées dans l’entrepôt, elles sont traitées et transformées et prêtes pour toutes future utilisation. En effet, les utilisateurs peuvent ensuite y accéder à l’aide d’outils d’informatique décisionnelle (requêtes OLAP : Online analytical Processing), de clients SQL ou simplement via de feuilles de calcul.

De plus, les entrepôts de données rendent possible l’exploration de données et leur analyse. Ce processus implique de rechercher les tendances des consommateurs et client par le biais d’extraction des modèles à partir de l’analyse des données. Les décideurs s’appuient sur les modèles élaborer à partir de l’entrepôt augmenter les ventes et les revenus de l’entreprise [38].

Après avoir présenter les entrepôts de données, la suite du chapitre sera consacrée aux outils ETL (Extrat, Transform and Load) qui sont incontournables vue leur importance, à la fois dans le cadre des outils d’intégration et en même temps en tant que composant fondamental permettant d’alimenter les entrepôts de données.


Questions Fréquemment Posées

Qu’est-ce qu’un entrepôt de données ?

Un entrepôt de données est une architecture pouvant servir de base à des applications décisionnelles, conçue pour l’interrogation et l’analyse de données.

Quels sont les types d’architecture d’entrepôt de données ?

Il existe trois types d’architecture d’entrepôt de données : à un niveau, à deux niveaux et à trois niveaux.

Comment les entrepôts de données sont-ils utilisés dans le domaine de la santé ?

Dans le domaine de la santé, les entrepôts de données sont utilisés pour enregistrer les informations sur les patients des différentes unités de l’organisation médicale.

Rechercher
Télécharger ce mémoire en ligne PDF (gratuit)

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top