Compteur de mots différents : mesurer la richesse lexicale d’un texte
Le compteur de mots différents indique combien de mots uniques apparaissent dans un texte. Il permet de mesurer la richesse lexicale d’un contenu et d’identifier si le vocabulaire est varié ou au contraire très répétitif.
Contrairement à un compteur de mots classique qui donne le total de mots, un compteur de mots différents compte chaque mot une seule fois, même s’il apparaît plusieurs fois. Vous obtenez ainsi le nombre de mots uniques utilisés dans votre texte.
Le texte B a, en apparence, un vocabulaire plus varié que le texte A, même s’ils ont le même volume total.
Cette mesure aide à évaluer le niveau de variation du vocabulaire. Elle est utile pour les écrivains, étudiants, enseignants, rédacteurs web et toute personne qui souhaite enrichir son style.
Certains outils affichent aussi un indice de type “rapport termes différents / nombre total de mots”, pratique pour comparer plusieurs textes entre eux.
Si votre nombre de mots différents est très faible par rapport au total, cela peut indiquer des répétitions de vocabulaire. Dans ce cas, une réécriture ciblée permet souvent d’améliorer la qualité perçue du texte.
En référencement naturel, un vocabulaire trop limité peut donner un texte pauvre sur le plan sémantique. Un bon niveau de mots différents contribue à couvrir plus largement le champ lexical d’un sujet.
Il n’existe pas de seuil absolu. Un texte technique peut avoir un vocabulaire plus restreint mais adapté, alors qu’un texte littéraire gagnera souvent à avoir beaucoup de mots différents.
En général, oui : “manger”, “mangé”, “mangeons” seront comptés comme des mots différents. Pour des analyses plus fines, certains outils lemmatisent (regroupent les formes autour d’un même lemme), mais ce n’est pas systématique.
Ils augmentent mécaniquement le nombre de mots différents, mais ce phénomène est général à tous les textes. Certains outils permettent de filtrer ces “stop words” pour se concentrer sur le vocabulaire porteur de sens.
