Informatiques et Télécommunications

Les projets de fin d’études pfe en Informatique et Télécommunications

WUM et vie privée – Analyse des connaissances en WUM

WUM et vie privée – Analyse des connaissances en WUM 3.7 Analyse des connaissances L’analyse des résultats produits par les différentes techniques d’extraction de connaissances constitue l’étape finale en WUM. Elle revêt une importance capitale, car elle permet de valider et d’évaluer les motifs extraits. Dans cette phase, les connaissances découvertes seront inspectées afin d’en […]

WUM et vie privée – Analyse des connaissances en WUM Read More »

L’ECD : la classification et les motifs séquentiels

L’ECD : la classification et les motifs séquentiels 3.6.5 La classification Dans cette tâche d’ECD, on se focalise sur le regroupement des données en ensembles de classes prédéfinies. Dans le cadre du WUM et généralement dans le web, on s’intéresse notamment à la construction de profils utilisateurs appartenant à des catégories particulières selon leurs motifs d’usage,

L’ECD : la classification et les motifs séquentiels Read More »

Extraction de connaissances en WUM et applications

Extraction de connaissances en WUM et applications 3.6 Extraction de connaissances et applications Une fois les données brutes d’usage préparées et formatées dans la phase précédente, elles seront prêtes à l’application des techniques de fouille de données en vue d’en extraire des motifs de navigation intéressants. Cette phase de découverte de connaissances est la plus

Extraction de connaissances en WUM et applications Read More »

Le formatage et l’intégration d’autres données d’usage

Le formatage et l’intégration d’autres données d’usage 3.5.3 Formatage Le formatage quant à lui, constitue l’étape finale du processus de prétraitement en WUM (Facca et al., 2005), durant laquelle les données d’usage collectées et préparées dans les étapes précédentes vont être transcrites et structurées dans une forme persistante. Bien qu’il soit possible de travailler sur

Le formatage et l’intégration d’autres données d’usage Read More »

Reconstruction des sessions et Processus de prétraitement en WUM

Reconstruction des sessions et Processus de prétraitement en WUM 3.5.2 Reconstruction de sessions Afin d’aboutir au fichier des sessions et après la phase de nettoyage des données d’usage, le processus de prétraitement en WUM inclut une étape de reconstruction des sessions. Cette dernière est en réalité constituée de trois sous tâches. Elle comprend l’identification des

Reconstruction des sessions et Processus de prétraitement en WUM Read More »

Le processus de prétraitement en WUM : le nettoyage des données

Le processus de prétraitement en WUM : le nettoyage des données 3.5 Prétraitement Comme nous l’avons vu dans le chapitre précédent, les indicateurs de métrologie relative au Web montrent une évolution exponentielle de celui-ci. Ainsi, et l’instar des données de contenu du Web, les données de son usage collectées dans des fichiers logs ont atteint à

Le processus de prétraitement en WUM : le nettoyage des données Read More »

Recueil de données : coté serveur, coté Proxy et coté client

Recueil de données : coté serveur, coté Proxy et coté client 3.4 Recueil de données Dans cette phase, différentes sortes de données sont collectées. Les plus communément exploitées sont les fichiers log enregistrés selon la position des dispositifs de collecte dans le réseau, les données issues des procédures d’inscription si disponibles, et les données sur la

Recueil de données : coté serveur, coté Proxy et coté client Read More »

Comportement des utilisateurs sur le Web et Processus en WUM

Comportement des utilisateurs sur le Web et Processus en WUM Chapitre 3 – Web Usage Mining, Etat de l’art et Problématique 3.1 Introduction Le Web a ouvert, depuis son apparition, plusieurs directions de recherche dans différentes disciplines. Il peut être considéré comme un laboratoire distribué et énorme permettant la capture, l’étude et l’analyse du comportement

Comportement des utilisateurs sur le Web et Processus en WUM Read More »

Le Web mining et les domaines associés : RI, BDD, AGENTS et WS

Le Web mining et les domaines associés : RI, BDD, AGENTS et WS 2.4 Web mining et domaines connexes Nous avons montré qu’avec le développement du Web, les études sur l’analyse des données qu’offre ce média, sur le plan des contenus, des structures et des usages ont suscité l’intérêt de plusieurs communautés de recherche issues d’origines

Le Web mining et les domaines associés : RI, BDD, AGENTS et WS Read More »

Web structure mining : PageRank, HITS et Web usage mining

Web structure mining : PageRank, HITS et Web usage mining 2.3.2 Web structure mining Le Web Structure Mining (WSM) se focalise sur l’analyse de la structure des liens entre les pages ou les sites Web, qui constitue une source riche d’information. Les recherches consacrées à cette branche du WM sont inspirées des travaux sur l’étude des

Web structure mining : PageRank, HITS et Web usage mining Read More »

Web content mining : Extraction, sélection et prétraitement

Web content mining : Extraction, sélection et prétraitement 2.3 Taxonomie pour le Web mining La première utilisation du terme Web mining (WM) est attribuée à Oren Etzioni dans un article consacré à l’étude de l’applicabilité de la technologie du data mining sur le Web. Dans ce papier originel (Etzioni, 1996), il définit le Web mining comme

Web content mining : Extraction, sélection et prétraitement Read More »

De la fouille de données à la fouille du Web : les propriétés

De la fouille de données à la fouille du Web : les propriétés Chapitre 2 – De la fouille de données à la fouille du Web 2.1 Préambule Depuis son apparition vers la fin des années 1980, comme le fruit des travaux menés par Tim Berners Lee1 au sein du CERN (Centre Européen pour la Recherche

De la fouille de données à la fouille du Web : les propriétés Read More »

Les techniques de fouille de données et ses limites

Les techniques de fouille de données et ses limites 1.4 Principales techniques de fouille de données Plusieurs techniques ont été élaborées pour la recherche de connaissances utiles à partir de données, les toutes premières sont simples et issues, dans la majorité, de la statistique et de l’analyse de données. Cependant il a été vite constaté

Les techniques de fouille de données et ses limites Read More »

Le processus d’extraction de connaissances ECD en WUM

Le processus d’extraction de connaissances ECD en WUM 1.3 Processus d’extraction de connaissances L’ECD est un processus homme-machine interactif et itératif, composé de plusieurs phases (Fayyad et al., 1996). Il est communément admis que c’est un processus partiellement automatique, où l’interaction de l’homme est primordiale. Il est itératif, dans le sens où l’utilisateur peut à

Le processus d’extraction de connaissances ECD en WUM Read More »

Les tâches en fouille de données

Les tâches en fouille de données 1.2.2 Les tâches en fouille de données La fouille de données est en fait un ensemble de techniques dédiées à différentes tâches groupées généralement en deux grandes catégories : des tâches descriptives et autres prédictives (Fayyad et al., 1996). Les tâches de la première catégorie ont pour objectifs de

Les tâches en fouille de données Read More »

Scroll to Top