Photo de Touza Isaac

Touza Isaac

Enseignant, Développeur et Doctorant en Informatique

Data Mining

Cycle Niveau
Superieur Master 1

Objectifs ou Compétences

Objectif général

  • Apprendre à maîtriser les techniques et modèles du data mining, afin de pouvoir les utiliser et les appliquer dans des situations réelles.

Objectifs spécifiques

  1. Rechercher et collecter les données : Utiliser diverses sources pour la collecte de données pertinentes.
  2. Nettoyer et analyser les données collectées : Préparer les données pour l'analyse en éliminant les erreurs et en transformant les données brutes en un format utilisable.
  3. Classer et recommander des informations/données : Appliquer des algorithmes de classification et de recommandation pour extraire des informations utiles.
  4. Prendre ou dégager une décision à partir des résultats des analyses : Utiliser les résultats des analyses pour formuler des recommandations ou prendre des décisions.

Description du Cours

Le cours de Data Mining se concentre sur l'apprentissage des techniques et modèles utilisés pour extraire des connaissances à partir de grandes quantités de données. Il couvre divers aspects du processus de data mining, depuis la collecte et le pré-traitement des données jusqu'à l'application des techniques de classification, de clustering, et de règles d'association. Les étudiants apprendront à utiliser des outils et des bibliothèques spécifiques en Python pour effectuer des analyses de données complexes et à interpréter les résultats pour la prise de décision.

Près-requis

  • Utilisation des bases de données
  • Connaissances en langage Python
  • Théorie des graphes

Plan du cours

  1. Introduction au Data Mining
    • Définitions et objectifs
    • Processus du Data Mining
    • Types de données et techniques
  2. Collecte et pré-traitement des données
    • Techniques de collecte et outils
    • Pré-traitement des données : nettoyage, transformation, sélection des caractéristiques
  3. Les règles d'association
    • Concepts de base
    • Algorithmes Apriori et FP-Growth
  4. La classification supervisée
    • Techniques de classification (ID3, C4.5, kNN, Bayes naïf)
    • Processus de classification et évaluation des performances
  5. Le clustering
    • Méthodes et applications du clustering (K-means, DBSCAN)

Ce cours s'adresse aux étudiants de la spécialité Data Sciences et Master Informatique, et leur fournira les compétences nécessaires pour devenir des experts en data mining.

Fichier du Cours

Télécharger le fichier du cours

Exercices