Ce projet est réalisé dans le cadre de l'aide à la prise de décision, pour répondre aux besoins des décideurs qui veulent implanter leurs points de vente dans un réseau de grandes surfaces spécialisées dans la vente des matériels électroniques sur le territoire français. Nous utilisons d'une part une technique de data mining : arbre de décision (algorithme CART) pour classifier la clientèle par le niveau de vie et d'autre part, l'analyse spatiale pour identifier les zones de marché les plus rentables des grandes surfaces spécialisées à implanter.
Deux phases dans cet algorithme : une phase d'expansion pour produire un arbre de décision maximal et une phase d'élagage pour produire un arbre de décision plus réduit qui ne s'éloigne pas de la performance de l'arbre de décision maximal. Nous avons réparti notre base de données à classer en deux échantillons : un échantillon d'apprentissage pour l'utiliser pendant les deux phases décrites précédemment et un échantillon test pour évaluer le taux d'erreur de l'arbre construit par l'échantillon d'apprentissage.
Ce projet permet d'évaluer la technique de l'arbre de décision (algorithme CART) en géomarketing. Or nous proposons d'appliquer des techniques de classifications conçus pour classer des bases de données de taille, très importantes.