Démonstrateur de résumé automatique

Ce démonstrateur de résumé automatique utilise la méthode MMR, décrite dans l'excellent article de J. Goldstein et J. Carbonell, sans aucun traitement linguistique. Par conséquent, les résultats ne sont pas au niveau des résumeurs automatiques qui utilisent des ressources supplémentaires : étiquetage morpho-syntaxique, détection des entités nommées... mais peut donner un aperçu de ce que l'on peut faire actuellement avec des traitements simples.  La fonction de score utilisée ici est LexRank, décrite dans l'article de G. Erkan et D. R. Radev (2004).

Pour le moment, le démonstrateur ne gère que le français. Je n'ai pas encore ajouté les stop listes (les listes qui définissent les mots vides, trop fréquents pour être pertinents) pour d'autres langues, mais c'est la prochaine étape du développement, ce avec une détection automatique des langues pour lesquelles j'aurais ajouté des stop listes.

Vous pouvez modifier les paramètres de génération du résumé pour générer des résumés de documents d'un maximum de 25.000 caractères. La qualité des données en entrée est primordiale, n'entrez si possible que des données encodées en utf-8, et des textes dont les phrases sont bien séparées par les caractères ( . ! ? )

 

Générer un résumé automatique

Texte à résumer :
0 caractères