Maître de conférences en informatique, j'effectue mes recherches au LIASD et mes enseignements au département informatique de l'IUT de Montreuil - Université Paris 8.  J'effectue majoritairement mes recherches en traitement automatique du langage, en particulier en résumé automatique.

J'ai soutenu ma thèse, dirigée par Thierry Poibeau et intitulée "Contribution au résumé automatique multi-documents" le 12 juillet 2010 (mention très honorable). Manuscrit de la thèse (format pdf)

Vous trouverez sur ce site des articles que j'ai publiés, un démonstrateur de résumé automatique, une rubrique "Le résumé automatique pour les nuls", qui vise à faire comprendre à ceux qui le souhaitent des méthodes  qui concernent mon domaine de recherche ainsi que divers outils dédiés à l'accessibilité de l'information.

L'outil "Les mots de l'actu" (voir les descriptions de l'outil, de ses mises à jour ou de son développement) fournit sous forme d'un nuage de mots les mots les plus représentatifs de l'actualité des 24 dernières heures. Il fournit également un un aperçu et un lien vers les articles qui les représentent le mieux afin de proposer un point d'accès original aux actualités les plus importantes du jour.

 

Pour inaugurer mon nouveau site web, je développe une interface web de résumé automatique. Celle-ci sera limitée en nombre de mots à résumer et les résumés qu'elle générera seront fondés sur l'approche MMR, décrite dans l'excellent article de J. Goldstein et J. Carbonell. Cette approche est moins gourmande en ressources que l'approche que j'ai développée durant ma thèse. Tout traitement linguistique sera exclu, ce qui aura pour conséquence de produire des résumés bien moins cohérents que ce que l'on peut faire actuellement avec un minimum de traitements (étiquetage des catégories morpho-syntaxiques, étiquetage et typage des entités nommées, normalisation des dates...) Je compte ensuite proposer des interfaces de résumés spécifiques à certains types de documents, et prendre en charge des fichiers pré-annotés par les utilisateurs dans un format spécifique.