Quelles implications politiques pour l’intégration des données ETL en 2023 ?

Pour citer ce mémoire et accéder à toutes ses pages
🏫 Université de 8 Mai 1945 – Guelma - Faculté des Mathématiques d'Informatique et des Sciences de la matière - Département d'Informatique
📅 Mémoire de fin de cycle en vue de l'obtention du diplôme de Master - 2022
🎓 Auteur·trice·s
BOUCENA Lilia
BOUCENA Lilia

Les implications politiques de l’intégration des données révèlent des enjeux cruciaux pour la gestion des informations dans un monde numérique. Cette recherche met en lumière une approche innovante d’architecture ETL, transformant la manière dont les entreprises exploitent des données hétérogènes pour optimiser leurs processus décisionnels.


La technologie d’intégration basée sur ETL

ETL est un acronyme qui désigne les termes ”Extract-Transform-Load”. Il s’agit d’un type de logiciel permettant de collecter des données en provenance de sources multiples pour ensuite les convertir dans un format adapté à une Data Warehouse et les y transférer.

Intérêt de la technologie ETL

Les avancées technologiques dans le secteur des système d’information et la démocratisation de l’utilisation d’Internet ont bouleversé le mode de fonctionnement des organisations et les modes de consommation des individus. En effet, on assiste aujourd’hui à une explosion étonnante de l’utilisation des machines de traitement de l’information et de communication équipées de multiples capteurs (téléphones, ordinateurs, smart TV, smart homes, . . .).

Une conséquence directe de cette utilisation intensive est l’explosion des données qui sont générées massivement, on parle de données massives ou (big data). Dans une perspective d’informatique décisionnelle (Business intelligence), l’utilisation rationnelle de grands volumes de données nécessite de les intégrer dans des formats appropriés, et de les rendre disponibles à des fins d’analyse qui permettent de faciliter la prise de décision.

Pour réaliser cet objectif, le processus ETL est une technique courante pour trouver des réponses à ces préoccupations, par la création d’une version unifiée des données et une vision centrale et unique de la réalité de l’entreprise. Assurez la collecte, la transformation et l’utilisation des données en fournissant des modèles et des outils pour extraire des données de sources disparates, tout en les intégrant dans un format unifié d’utilisation et en assurant les liens entre les composants ne peut se réaliser que par le déploiement d’un logiciel dédié qui est l’outil ETL.

D’autre part, les outils ETL permettront de produire et d’exécuter des fonctions spécifiques liées à l’accroissement spectaculaire des données, tels que des outils d’analyse et de reporting (OLAP).

De ce qui précède, le développement des moteurs ETL est devenu un processus omniprésent dans le traitement et la gestion des données qui vise à la préparation des ensembles de données volumineux et disparates pour des objectifs d’informatique décisionnelle basée sur l’exploitation des entrepôts de données. Ainsi, l’intégration des données contenues dans l’entrepôt permettra de concrétiser les scénarios d’analyse de données complexes.

Après avoir exposé l’intérêt des outils ETL, dans ce qui suit on va présenter quelques définitions qui lui sont associées et par la suite on va aborder leur mode de fonctionnement.

Quelques définitions des outils ETL

Les outils ETL sont des logiciels qui sont apparus dans les années 1970 pour intégrer des données éparses et hétérogènes, les préparer et les centraliser dans une structure de données unique.

Plus explicitement, on donne ci-dessous quelques définitions précises.

Définition 2.4 Un logiciel ETL est un intergiciel (middleware) pour la gestion de gros volumes de données au sein d’un système complexe. Il assure la collecte des données d’une ou plusieurs sources pour les transformer en des des ressources exploitables et enfin, les charger sous une vue centralisée dans un entrepôt de données [39].

Définition 2.5 ETL est un procédure permettant d’effectuer des synchronisations massives d’informations entre bases de données qui commence par l’extraction des données des bases de données de production. Puis, leur transformation pour effectuer des calculs, pour les enrichir avec des données externes et enfin, le chargement des données dans les différentes applications décisionnelles [39].

Une autre définition plus précise est donnée dans [40]

Définition 2.6 Un ETL (Extract Transform Load) est un middleware permettant d’effectuer des synchronisations de données entre différents systèmes. Il extrait les données, les manipule (conversion, suppression des doublons, . . .) et les intègre dans un référentiel commun qui est l’entrepôt de données (datawarehouse).

D’après ces définitions, on énonce ci-après notre propre définition et que nous allons retenir dans la suite du mémoire.

Définition 2.7 Un logiciel ETL est un intergiciel (middleware) qui permet de collecter les données en provenance de sources multiples pour ensuite les convertir dans un format adapté à un entrepôt de données, et enfin de les y charger.

Cette dernière définition, met en exergue les trois opérations fondamentales utiles à l’intégration des données via un outils ETL. Il s’agit des opérations d’extraction, de transformation et de chargement.

[9_implications-politiques-de-integration-des-donnees-etl_17]

La figure 2.9 suivante, illustre le séquencement des trois opérations assurées par un outil ETL.

Figure 2.9 – Les trois opération d’outil ETL Ces trois opérations sont examinées en détails dans ce qui suit.

Extraction

Cette opération permet d’identifier et d’extraire les données des sources utiles à l’alimentation de l’entrepôt de données. Elle peut se faire de manière totale, dans le cas d’un chargement initial, ou bien de manière incrémental si certaines sources ont subi des modifications depuis la dernière exécution du chargement.

Transformation

Consiste à appliquer certaines règles de transformations aux données pour les nettoyer, les intégrer et les agréger.

Chargement

Action qui consiste à insérer les données transformées dans l’entrepôt et de gérer les changements des données existantes.


Questions Fréquemment Posées

Qu’est-ce que la technologie ETL?

ETL est un acronyme qui désigne les termes ‘Extract-Transform-Load’. Il s’agit d’un type de logiciel permettant de collecter des données en provenance de sources multiples pour ensuite les convertir dans un format adapté à une Data Warehouse et les y transférer.

Pourquoi est-il important d’utiliser des outils ETL?

Les outils ETL permettent de produire et d’exécuter des fonctions spécifiques liées à l’accroissement spectaculaire des données, tels que des outils d’analyse et de reporting (OLAP), et assurent la collecte, la transformation et l’utilisation des données.

Comment fonctionne un logiciel ETL?

Un logiciel ETL est un intergiciel (middleware) pour la gestion de gros volumes de données. Il assure la collecte des données d’une ou plusieurs sources, les transforme en ressources exploitables et les charge sous une vue centralisée dans un entrepôt de données.

Rechercher
Télécharger ce mémoire en ligne PDF (gratuit)

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Scroll to Top