Fouille de données

 

Les méthodes de fouille de données rassemblent des algorithmes de mesure des similitudes et dissemblances existant entre les objets d'un tableau de données (souvent de grande dimension), en vue de détecter dans ces données des associations, des règles d'associations, des tendances inconnues (non fixées a priori), des structures particulières qui restituent de façon concise l’essentiel de l’information du tableau. C'est pourquoi on les qualifie aussi de techniques d'apprentissage.

 

Ce chapitre décrit cinqthodes largement utilisées: deux méthodes descriptives -- l'analyse factorielle exploratoire et la recherche des plus proches voisins, et trois méthodes prédictives -- l'analyse factorielle discriminante, l'analyse des régressions linéaires multiples et l'analyse des régressions logistiques multiples.

 

Les méthodes descriptives utilisent des algorithmes d'apprentissage non supervisés pour mettre en évidence des informations présentes mais cachées par le grand volume des données (exemple : les territoires d'une région).

 

Les méthodes prédictives utilisent des algorithmes d'apprentissage supervisé (predictive algorithms) pour expliquer la valeur d'une variable "cible" (exemples : le coefficient multiplicateur des activité basiques d'un territoire, le comportement d'achat des consommateurs).

 

On trouvera des exemples d'application d'une autre méthode d'apprentissage supervisé --basée sur l'analyse des probabilités -- dans Applications

 

 

Contact

© 2014 Tous droits réservés.

Créer un site internet gratuitWebnode