Articles

Fréquences des mots : Analyser les fréquences des mots

La fonction la plus simple de MAXDictio détermine le vocabulaire de tous les textes d’un projet en cours.

Cette fonction est accessible soit :

  • en sélectionnant l’option MAXDictio >Fréquences de mots, soit
  • en cliquant simplement sur le bouton rapide correspondant dans la barre d’outils « MAXDictio ».

Après avoir lancé la fonction, la fenêtre de dialogue suivante apparaît. Vous pouvez y sélectionner toutes les options dont vous avez besoin.

Sélection des textes à analyser

Seulement pour les documents activés – la procédure de fréquences sera limitée aux fichiers texte activés

Seulement dans les segments récupérés – la procédure de fréquences sera limitée aux segments codés réellement affichés dans la fenêtre « Segments récupérés »

Si aucune des deux options n’est sélectionnée, tous les documents texte et tableau du projet MAXQDA seront analysés.

Note : Sachez que la césure n’est pas reconnue dans les documents PDF.

Différenciation des résultats

Non : Le tableau des résultats ne différencie pas les résultats, fournissant seulement les totaux sur tous les textes analysés.

Par documents, groupes de documents, ensembles de documents : Le tableau des résultats contient des colonnes supplémentaires qui peuvent être utilisées pour comparer la fréquence des mots dans des documents individuels, des groupes de documents ou des ensembles de documents (voir Différenciation par documents, groupes de documents et ensembles de documents). Lorsque l’option Uniquement pour les documents activés est sélectionnée, seuls les documents activés au sein des groupes de documents ou des ensembles de documents sont pris en compte, et seuls les groupes de documents ou les ensembles de documents contenant des documents activés seront analysés.

Par codes : Cette option n’est disponible que si l’analyse est limitée aux segments des « Segments récupérés » et qu’une « Requête de codage simple » a été effectuée. Le tableau de résultats contient des colonnes supplémentaires de fréquences récurrentes pour chaque code qui apparaît dans le « Système de codes ». Cette option est particulièrement utile lorsque les textes ont été divisés en unités de texte utilisant des codes pour l’analyse MAXDictio, car elle permet de comparer les fréquences des mots au sein de différents codes.

Autres options

Caractères à couper : En cliquant sur le bouton avec trois points , vous ouvrez une boîte de dialogue dans laquelle vous pouvez saisir les caractères qui doivent être coupés des mots et ignorés pendant le comptage. Les caractères sélectionnés dans la boîte de dialogue s’appliquent à toutes les fonctions basées sur les mots dans MAXQDA et MAXDictio.

Comment MAXDictio définit-il un « mot » ? Un mot, comme montré ci-dessus, est toute séquence de caractères comprise entre deux caractères délimiteurs. Les délimiteurs peuvent être, par exemple, des espaces blancs ou des signes de ponctuation. Prenons l’exemple de « travail ». En tant que dernier mot d’une phrase, ce mot est délimité par un espace à sa gauche et un point à sa droite.

Les caractères à utiliser comme délimiteurs doivent être saisis dans la boîte de dialogue « Caractères à couper ». Normalement, ces caractères comprennent des signes de ponctuation, des points d’interrogation, etc. La sélection des caractères est stockée dans le projet respectif de sorte que les mêmes résultats seront obtenus pour les fonctions de MAXDictio même si vous ouvrez le fichier sur un autre ordinateur. Par défaut, les caractères suivants sont saisis automatiquement dans les nouveaux projets:

@ ! § $ % & / ( ) = ? ^ ° ‘ ‘ `  »  »  »  »  » { } # + * _ . : , ; < > ~ –

Certains problèmes peuvent survenir avec les traits d’union. Si les mots composés doivent être comptés comme un seul mot et ne pas être divisés en leurs parties distinctes, le trait d’union ne peut pas être déclaré comme délimiteur. Il est préférable d’expérimenter un peu avec différentes possibilités. Comme le comptage des fréquences de mots peut être répété sans perte de temps significative, il est conseillé d’examiner les résultats pour repérer toute conspicuosité, de modifier les options si nécessaire, puis de répéter l’analyse.

Nombre minimal de caractères – les mots comportant moins de caractères seront ignorés

Appliquer une liste d’arrêt – Si une liste d’arrêt doit être utilisée, la case correspondante doit être cochée. Cliquez sur le bouton avec les trois points pour ouvrir et éditer les listes d’arrêt.

Sensibilité à la casse : Si ce paramètre est activé, « Give » et « give », par exemple, seront comptés comme des mots différents. Si le paramètre est inactif, tous les mots seront affichés en minuscules dans la liste des résultats.

Lemmatiser les mots : lorsque cette case est cochée, les mots identifiés dans les textes seront simplifiés à leurs racines de mots (lemmes) en utilisant un lexique de lemmes dans la langue choisie. Par exemple, si un texte contient les mots « a donné », « donné » et « donne », MAXDictio ne listera que la forme de base « donner » dans le tableau de résultats.

Cliquez sur OK, pour commencer l’analyse des fréquences des mots. En fonction de la taille des textes, ce processus peut prendre quelques instants. Un affichage vous informe de la progression de l’analyse.