Le module se se concentre sur les méthodes d'apprentissage statistique et de fouille de données. Après une introduction des différents types de problèmes d'apprentissage statistique (supervisé, non-supervisé, etc.) en les illustrant dans le cadre de la fouille de données, les principes sur lesquels reposent les méthodes d'apprentissage statistique seront développés (notions de risques structurel/empirique, compromis biais/variance, validation des modèles, etc.). Les grandes classes de méthodes existantes d'apprentissage statistique seront ensuite détaillées: plus proches voisins, réseaux de neurones, méthodes à base de noyaux, réduction de dimension, etc. La partie fouille de données se concentre sur les motifs séquentiels du point de vue méthodologique ainsi que du point de vue usage à travers leur utilité pour la fouille de données textuelles. |