Découverte de sous-groupes à partir de données séquentielles par échantillonnage et optimisation locale
Résumé
La découverte de règles caractéristiques d'une classe reste un pro-
blème difficile, particulièrement dans le cadre des données séquentielles (sé-
quences d'ensembles). La découverte de sous-groupes est une bonne formalisa-
tion de cette tâche et de nombreux algorithmes dédiés ont été proposés ces 20
dernières années. Une exploration dite exhaustive est souvent inapplicable au vu
de la taille de l'espace de recherche, et les méthodes heuristiques de référence,
principalement les recherches en faisceau, posent des problèmes de paramétrage.
Nous proposons une méthode d'échantillonnage depuis l'espace des motifs pour
la découverte de sous-groupes dans des données séquentielles étiquetées. Celle-
ci permet, entre autres, de trouver des optima locaux, ne nécessite pas de para-
métrage, est indépendante de la mesure de qualité utilisée, et est simple à mettre
en oeuvre. La validation empirique sur divers jeux de données nous permet de
valider les qualités de cette approche.