Résumer un texte par extraction, c'est réussir à trouver dans ce texte des phrases qui, mises ensemble, génèrent un résumé qui à la fois retient l'essentiel et capte un maximum de cet essentiel. C'est ce qu'on appelle le le compromis centralité/diversité. Evidemment, le résumé doit valider des contraintes, souvent en nombre de mots, ce qui complexifie le problème. Alors, une fois qu'on a réussi à évaluer la centralité, donc le fait qu'une phrase véhicule des informations essentielles, comment faire pour maximiser la diversité ? Nous voyons ici la méthode MMR (Maximal Margin Relevance), définie par Golstein et Carbonell (1998).