La méthodologie de détection marine développée dans cet article détaille les techniques de collecte et de prétraitement des données, ainsi que les algorithmes d’intelligence artificielle utilisés pour la classification des objets marins. Les résultats des simulations attestent de l’efficacité des méthodes proposées.
Chapitre 2
Méthodologie de Développement
Introduction
Ce chapitre présente en détail l’approche méthodologique adoptée pour le développement d’un système avancé de détection et de classification des objets marins en temps réels.
Nous décrirons les méthodes et techniques utilisées pour collecter les données, les stratégies de prétraitement des données, les algorithmes d’IA sélectionnés, ainsi que les méthodes d’évaluation des performances de notre système.
Comparaison des différentes méthodologies
Pour déterminer la meilleure méthodologie à adopter pour notre projet de fin d’études, nous allons comparer plusieurs approches couramment utilisées dans les projets de data mining et de science des données. Cette comparaison nous permettra d’identifier les forces et les faiblesses de chaque méthodologie et de choisir celle qui s’adapte le mieux à nos objectifs et contraintes spécifiques.
Tableau 2.1 : Comparaison des différentes méthodologies | ||||
---|---|---|---|---|
CRITÈRES | CRISP-DM[11] | KDD[12] | SEMMA[13] | TDSP[14] |
Acronyme | CRoss-Industry Standard Process for Data Mining | Knowledge Discovery in Databases | Sample, Explore, Modify, Model, Assess | Team Data Science Process |
Origine | Développé par Daimler-Benz, SPSS, NCR en 1996 | Introduit par Usama Fayyad en 1996 | Développé par SAS Institute | Développé par Microsoft |
Phases | Compréhension du Domaine, Compréhension des Données, Préparation des Données, Modélisation, Évaluation, Déploiement | Sélection, Prétraitement, Transformation, Data Mining, Interprétation/Évaluation | Échantillonner, Explorer, Modifier, Modéliser, Évaluer | Définir, Préparer les données, Construire le modèle, Déployer, Gérer |
Approche | Itérative et cyclique | Processus d’extraction de connaissances | Processus axé sur les outils et les méthodes statistiques | Approche orientée équipe et projet |
Utilisation | Large adoption dans l’industrie | Académique et recherche | Analytique et modélisation statistique | Projets d’équipe en entreprise |
Flexibilité | Très flexible, applicable à divers secteurs | Plutôt rigide, centré sur la découverte des connaissances | Centré sur les outils SAS, moins flexible sans SAS | Flexible, supporte divers outils et langages |
Documentation | Bien documenté, avec de nombreux exemples | Documentation académique disponible | Documentation fournie par SAS | Documentation fournie par Microsoft, intégrée à Azure |
Adoption | Très répandu, standard industriel | Moins répandu dans l’industrie, plus académique | Utilisé par les utilisateurs de SAS | Adoption croissante avec la popularité de Microsoft Azure |
Pour notre étude, nous allons adopter la méthodologie CRISP-DM parce qu’elle est largement reconnue et adoptée dans l’industrie, ce qui en fait un cadre éprouvé et fiable. Son statut de standard industriel assure une certaine cohérence et comparabilité entre les projets. En outre, CRISP-DM est indépendant des outils et des technologies spécifiques, ce qui signifie qu’il peut être utilisé avec n’importe quelle plateforme de data mining ou de science des données, offrant ainsi une grande flexibilité technique (voir Figure 2.1).
[detection-objets-marins-par-drone-avance_1]
Figure 2.1 – Présentation de CRISP-DM
Compréhension du domaine
Dans cette section, nous abordons la compréhension approfondie du domaine d’application de notre projet, en examinant les spécificités et les enjeux liés aux objets marins et à la détection par drone, afin de mieux orienter le développement et l’optimisation de notre système de détection avancée.
Objectif
L’objectif de l’étude de la compréhension du domaine est d’acquérir une connaissance approfondie des environnements marins et des caractéristiques des objets à détecter.
Résumé des fonds marins
L’image ci-dessous illustre les différentes caractéristiques des fonds marins. On y observe les principales zones : le plateau continental, le talus continental, et les grands-fonds. Cette illustration aide à visualiser la structure des fonds marins et leur organisation [15] (voir Figure 2.2).
[detection-objets-marins-par-drone-avance_1]
Figure 2.2 – Illustration de fond marin
- Plateau Continental : Zone peu profonde qui s’étend depuis le littoral jusqu’à une profondeur d’environ 200 mètres. C’est la partie émergée sous l’eau des continents et il est généralement riche en biodiversité marine.
- Talus Continental : Zone de transition entre le plateau continental et les grands-fonds. Il se caractérise par une pente plus raide où la profondeur augmente rapidement.
- Grands-Fonds ou Plaine Abyssale : Région profonde de l’océan, généralement située entre 5 000 et 6 000 mètres de profondeur. Cette zone comprend :
- Dorsales Océaniques : Chaînes de montagnes sous-marines formées par des mouvements tectoniques.
- Monts Sous-Marins : Montagnes sous-marines isolées.
- Fosses Océaniques : Dépressions profondes formées par la subduction des plaques tectoniques.
Importance géoclimatique et environnementale
Les fonds marins jouent un rôle crucial en tant que puits de carbone, ce qui aide à réguler le climat terrestre. Ils contiennent également des quantités importantes d’hydrates de méthane, qui, s’ils se libèrent, peuvent accélérer le réchauffement climatique.
Impact humain
Les fonds marins sont le site de nombreuses activités humaines :
- Câbles et Fibres Optiques : Un réseau étendu de câbles sous-marins traverse les fonds marins, facilitant les communications globales mais pouvant interférer avec les activités de pêche au chalut.
- Décharges : Historiquement, les fonds marins ont été utilisés comme décharges, notamment pour des déchets chimiques, radioactifs, et militaires. Un exemple notable est la fosse des Casquets, qui contient des déchets radioactifs.
- Épaves : De nombreuses épaves de navires et plus récemment d’avions reposent sur les fonds marins. Une découverte célèbre est celle du Titanic en 1987, localisé à 3 850 mètres de profondeur, près de Terre-Neuve.
[detection-objets-marins-par-drone-avance_1]
Figure 2.3 – Épave d’avion
Les fonds marins représentent ainsi une composante essentielle et complexe des environnements océaniques, influençant à la fois le climat et les activités humaines tout en restant un sujet d’exploration et de préoccupation environnementale.
Analyse des données existantes
L’analyse des données existantes enrichit considérablement notre compréhension du domaine [16]. Cela inclut :
- Bases de données écologiques : Les bases de données, comme OBIS (Ocean Biogeographic Information System), fournissent des informations sur la répartition géographique des espèces, aidant à comprendre où les espèces sont les plus susceptibles d’être trouvées.
[detection-objets-marins-par-drone-avance_1]
Figure 2.4 – Base de données OBIS
L’image 2.4 ci dessus montre un aperçu de la base de données OBIS
- Études de biodiversité marine : Les études de biodiversité, telles que celles menées par le Census of Marine Life, révèlent des modèles saisonniers et des interactions écologiques cruciales.
Conditions météorologiques et climatiques
Cette section explore l’influence des conditions météorologiques et climatiques sur les habitats marins, en abordant les effets des tempêtes, cyclones et variations climatiques sur les écosystèmes marins, ainsi que l’impact significatif de phénomènes climatiques [17]. Cela inclut :
- Effets des tempêtes, des cyclones et des variations climatiques sur les habitats marins : Les événements météorologiques extrêmes, comme les ouragans, peuvent détruire des habitats critiques et affecter la distribution des espèces.
- Étude des phénomènes tels que le phénomène El Niño et son impact sur les écosystèmes marins : Le phénomène El Niño provoque des variations climatiques significatives, entraînant des changements dans la température de l’eau et des courants océaniques, affectant ainsi les écosystèmes marins.
[detection-objets-marins-par-drone-avance_1]
Figure 2.5 – Exemple de récifs coralliens
L’image 2.5 ci dessus montre les dernières estimations de l’Organisation des Nations Unies pour l’éducation, la science et la culture mettent en garde sur le fait que plus de la moitié des espèces marines pourraient être au bord de l’extinction d’ici 2100.
Compréhension des données
Cette section vise à évaluer et comprendre les caractéristiques des données disponibles pour la détection et la classification des objets marins.
- Objectif : Évaluer et comprendre les caractéristiques des données disponibles pour la détection et la classification des objets marins.
Nous avons utilisé Roboflow, un outil puissant pour la gestion, l’annotation et le prétraitement des données d’images. Il permet de créer et d’ajuster des annotations facilement tout en assurant la compatibilité avec divers formats de données pour l’entraînement des modèles de vision par ordinateur [18] (voir Figure 2.6).
[detection-objets-marins-par-drone-avance_1]
Figure 2.6 – Présentation de Roboflow
- Collecte et annotation des données : Nous avons collecté un ensemble de données comprenant 1525 images d’objets marins provenant de Kaggle, une plateforme de partage de données. Chaque image a été minutieusement annotée sur Roboflow pour marquer les positions et les classes des objets marins présents. Cette approche garantit la qualité et la fiabilité des données d’entraînement en fournissant des informations précises sur la localisation et l’identification des objets marins dans chaque image (voir Figure 2.7).
[detection-objets-marins-par-drone-avance_1]
Figure 2.7 – Annotation Roboflow
- Exploration des distributions de classe : L’analyse des distributions de classe dans notre ensemble de données est essentielle pour identifier tout déséquilibre potentiel entre les différentes catégories d’objets marins. Cela nous permet d’adapter nos stratégies d’entraînement et de validation pour assurer des performances équitables et précises pour toutes les classes, minimisant ainsi les biais et améliorant la généralisation du modèle.
- Évaluation de la qualité des annotations : Chaque annotation est rigoureusement évaluée pour assurer sa précision et sa cohérence avec les définitions de classe établies. Les erreurs potentielles sont corrigées à l’aide d’outils d’annotation automatique ou manuellement, garantissant ainsi l’exactitude des données d’entraînement et réduisant les sources de bruit ou d’ambiguïté qui pourraient affecter les performances du modèle final.
- Exploration des métadonnées : En plus des images et des annotations, nous examinons les métadonnées associées telles que la localisation géographique, les conditions environnementales et les informations temporelles. Ces métadonnées enrichissent le contexte entourant chaque observation d’objet marin, fournissant des informations supplémentaires sur les conditions environnementales et les facteurs contextuels qui pourraient influencer la détection et la classification des objets marins.