Adresse
Infodoc : Réseau des bibliothèques et centres de documentation d'AgroParisTechFrance
contact
Array ( [TITRE] => <b>Type de document : </b> [TITRE_CLEAN] => Type de document [OPAC_SHOW] => 1 [TYPE] => list [AFF] => Thèse [ID] => 4 [NAME] => cp_typdoc [DATATYPE] => integer [VALUES] => Array ( [0] => 1 ) )
Titre : |
Clustering prédictif : Décrire et Prédire simultanément
|
Auteur(s) : |
Oumaima Alaoui Ismaili, Auteur
Antoine Cornuéjols, Directeur de thèse |
Type de document : | Thèse |
Résumé : |
Le clustering prédictif est un nouvel aspect d’apprentissage supervisé dérivé du clustering standard. Les algorithmes appartenant à ce type de l’apprentissage cherchent à décrire et à prédire d’une manière simultanée. Il s’agit de découvrir la structure interne d’une variable cible. Puis munis de cette structure, de prédire la classe des nouvelles instances. Pour atteindre l’objectif de la thèse qui est la recherche d’un modèle d’apprentissage "interprétable" capable de décrire et de prédire d’une manière simultanée, nous avons choisi de modifier l’algorithme des K-moyennes standard. Cette version modifiée est nommée les K-moyennes prédictives. Elle contient 7 différentes étapes dont chacune peut être supervisée indépendamment des autres. Au cours de cette thèse, nous nous intéressons[...]
Le clustering prédictif est un nouvel aspect d’apprentissage supervisé dérivé du clustering standard. Les algorithmes appartenant à ce type de l’apprentissage cherchent à décrire et à prédire d’une manière simultanée. Il s’agit de découvrir la structure interne d’une variable cible. Puis munis de cette structure, de prédire la classe des nouvelles instances. Pour atteindre l’objectif de la thèse qui est la recherche d’un modèle d’apprentissage "interprétable" capable de décrire et de prédire d’une manière simultanée, nous avons choisi de modifier l’algorithme des K-moyennes standard. Cette version modifiée est nommée les K-moyennes prédictives. Elle contient 7 différentes étapes dont chacune peut être supervisée indépendamment des autres. Au cours de cette thèse, nous nous intéressons à la supervision de quatre étapes, à savoir : 1) le prétraitement des données, 2) l’initialisation des centres, 3) le choix de la meilleure partition et 4) la mesure d’importance des variables. Nos résultats expérimentaux montrent d’une part qu’avec la supervision de l’étape de prétraitement des données et de l’étape d’initialisation des centres, l’algorithme des Kmoyennes prédictives parvient à avoir des performances très compétitives ou meilleures que celles obtenues par certains algorithmes de clustering prédictif. D’autre part, ces résultats expérimentaux mettent l’accent sur la capacité de nos méthodes de prétraitement à aider l’algorithme des K-moyennes prédictives à fournir des résultats facilement interprétables par l’utilisateur. Nous montrons enfin dans ce mémoire qu’avec l’aide du critère d’évaluation proposé dans cette thèse, l’algorithme des K-moyennes prédictives parvient à sélectionner la partition optimale qui réalise le bon compromis entre la description et la prédiction. Ceci permet à l’utilisateur de découvrir les différentes raisons qui peuvent mener à une même prédiction.
|
Editeur(s) : | Gif-sur-Yvette [France] : Université Paris-Saclay |
Date de publication : | 2016 |
Format : | 1 vol. (200 p.) / 30 cm |
Note(s) : |
Bibliographie p. 195-201
|
Langue(s) : | Français |
Lien vers la notice : | https://infodoc.agroparistech.fr/index.php?lvl=notice_display&id=196387 |
Exemplaires (1)
Localisation | Emplacement | Pôle | Section | Cote | Support | Disponibilité |
---|---|---|---|---|---|---|
Palaiseau | Magasin - compactus | THE 2016 ALA | Papier | Consultable sur place Exclu du prêt |