VIIIème Ecole de Cosmologie
28 août -2 septembre 2006
IESC, Cargèse

Caractérisation statistique
d’échantillons cosmologiques

Méthodes de classification

Jean-Yves TOURNERET
IRIT - ENSEEIHT - TéSA, Toulouse

La classification et la reconnaissance des formes sont des disciplines qui intéressent de nombreuses communautés comme la communauté statistique, le traitement du signal et des images, le traitement de la parole ... Tout problème de classification  peut se décomposer en deux étapes essentielles :
  • L'extraction et la sélection de paramètres pertinents : cette étape est fortement liée à la nature des signaux étudiés. Par exemple, les paramètres appropriés à la reconnaissance de la parole ou à la classification d'images sont différents et découlent de la structure naturelle du signal de parole ou d'une image. Les techniques d'analyse de données comme l'analyse en composantes principales ou l'analyse factorielle discriminante permet également d'obtenir des informations intéressantes pour l'extraction de paramètres.
  • L'apprentissage : la règle de classification optimale (par exemple en termes de probabilité d'erreur) issue de l'analyse statistique Bayésienne nécessite la connaissance a priori des propriétés statistiques des observations de chaque classe. Lorsque cette connaissance n'est pas disponible, on a recours à une phase d'apprentissage qui consiste à estimer les quantités inconnues à l'aide de données. On parle d'apprentissage supervisé Lorsque la classe de ces vecteurs de données est connue, et d'apprentissage non supervisé dans le cas contraire.
Le cours sera découpé en trois chapitres :
  1. Méthodes d'analyse de données pour la sélection de paramètres
  2. "Classifieur" Bayésien et Apprentissage
  3. Réseaux de neurones et machines à vecteurs supports

Programme