De quoi parle un texte ? En quoi son style est-il différent des autres ? Comment définir et mesurer automatiquement ce qui caractérise une langue, un texte ou un auteur ? Le domaine de la modélisation numérique du langage est en pleine révolution. A l'aide d'exemples (Proust, le polar ou le discours politique...) la conférence présentera différentes approches permettant de caractériser un ensemble de textes. La compréhension de ces modèles numériques permet aussi de mieux appréhender les limites de leurs utilisations pour la génération automatique de textes.

Par Cyril Labbé, Laboratoire d'Informatique de Grenoble

En cours de chargement ...