RNTI

MODULAD
Découverte de sous-groupes à partir de données séquentielles par échantillonnage et optimisation locale
In EGC 2019, vol. RNTI-E-35, pp.153-164
Résumé
La découverte de règles caractéristiques d'une classe reste un pro- blème difficile, particulièrement dans le cadre des données séquentielles (sé- quences d'ensembles). La découverte de sous-groupes est une bonne formalisa- tion de cette tâche et de nombreux algorithmes dédiés ont été proposés ces 20 dernières années. Une exploration dite exhaustive est souvent inapplicable au vu de la taille de l'espace de recherche, et les méthodes heuristiques de référence, principalement les recherches en faisceau, posent des problèmes de paramétrage. Nous proposons une méthode d'échantillonnage depuis l'espace des motifs pour la découverte de sous-groupes dans des données séquentielles étiquetées. Celle- ci permet, entre autres, de trouver des optima locaux, ne nécessite pas de para- métrage, est indépendante de la mesure de qualité utilisée, et est simple à mettre en oeuvre. La validation empirique sur divers jeux de données nous permet de valider les qualités de cette approche.