Articles

Word Frequencies: Analyze Word Frequencies

De eenvoudigste functie van MAXDictio bepaalt de woordenschat van alle teksten van een huidig project.

Deze functie kan worden opgeroepen door:

  • de optie MAXDictio >Woordfrequenties te selecteren, of
  • door gewoon op de corresponderende snelknop in de werkbalk “MAXDictio” te klikken.

Nadat de functie is gestart, verschijnt het volgende dialoogvenster. Hier kunt u alle gewenste opties selecteren.

Selectie van te analyseren teksten

Alleen voor geactiveerde documenten – de frequentieprocedure wordt beperkt tot de geactiveerde tekstbestanden

Alleen in opgehaalde segmenten – de frequentieprocedure wordt beperkt tot de gecodeerde segmenten die daadwerkelijk in het venster “Opgehaalde segmenten” worden weergegeven

Als geen van beide opties is geselecteerd, worden alle tekst- en tabeldocumenten in het MAXQDA-project geanalyseerd.

Bedenk wel dat koppeltekens niet worden herkend in PDF-documenten.

Differentiatie van resultaten

Niet: De resultatentabel maakt geen onderscheid tussen de resultaten en geeft alleen de totalen over alle geanalyseerde teksten.

Op documenten, documentgroepen, documentensets: De resultatentabel bevat extra kolommen die gebruikt kunnen worden om de woordfrequentie binnen individuele documenten, documentgroepen of documentensets te vergelijken (zie Differentiatie naar documenten, documentgroepen en documentensets). Als de optie Alleen voor geactiveerde documenten is geselecteerd, wordt alleen rekening gehouden met geactiveerde documenten binnen de documentgroepen of documentverzamelingen, en worden alleen documentgroepen of documentverzamelingen geanalyseerd die geactiveerde documenten bevatten.

Op basis van codes: Deze optie is alleen beschikbaar als de analyse beperkt is tot de segmenten in de “Opgehaalde segmenten” en er een “Eenvoudige coderingsquery” is uitgevoerd. De resultatentabel bevat extra kolommen met terugkerende frequenties voor elke code die voorkomt in het “Codesysteem”. Deze optie is vooral nuttig wanneer teksten met behulp van codes voor MAXDictio-analyse in teksteenheden zijn verdeeld, omdat u zo de woordfrequenties binnen verschillende codes kunt vergelijken.

Volgende opties

Charakters die moeten worden afgesneden: Door op de knop met drie puntjes te klikken, opent u een dialoogvenster waarin u tekens kunt invoeren die van de woorden moeten worden afgesneden en tijdens de telling moeten worden genegeerd. De geselecteerde tekens in het dialoogvenster zijn van toepassing op alle woord-gebaseerde functies in MAXQDA en MAXDictio.

Hoe definieert MAXDictio een “woord”? Een woord, zoals hierboven getoond, is elke reeks tekens tussen twee scheidingstekens. Scheidingstekens kunnen bijvoorbeeld spaties of leestekens zijn. Neem het voorbeeld “werk”. Als laatste woord van een zin wordt dit woord begrensd door een spatie aan de linkerkant en een punt aan de rechterkant.

De tekens die als scheidingstekens moeten worden gebruikt, moeten worden ingevoerd in het dialoogvenster “Tekens die moeten worden afgebroken”. Normaal omvatten deze tekens interpunctietekens, vraagtekens, enz. De selectie van tekens wordt opgeslagen in het betreffende project, zodat dezelfde resultaten worden verkregen voor MAXDictio-functies, zelfs als u het bestand op een andere computer opent. Standaard worden de volgende tekens automatisch ingevoerd in nieuwe projecten:

@ ! § $ % & / ( ) = ? ^ ° ‘ ´ ` ” ” ” ” ” { } # + * _ . : , ; < > ~ –

Sommige problemen kunnen zich voordoen met koppeltekens. Als samengestelde woorden als één woord moeten worden geteld en niet in hun afzonderlijke delen mogen worden gesplitst, mag het koppelteken niet als scheidingsteken worden aangegeven. Het is het beste een beetje te experimenteren met verschillende mogelijkheden. Aangezien het tellen van de woordfrequenties zonder noemenswaardig tijdverlies herhaald kan worden, is het raadzaam om de resultaten door te nemen op opvallende punten, de opties eventueel te wijzigen en vervolgens de analyse te herhalen.

Minimaal aantal tekens – woorden met minder tekens worden overgeslagen

Toegepaste stoplijst – Als een stoplijst gebruikt moet worden, moet het betreffende vakje aangevinkt zijn. Klik op de knop met de drie puntjes om de stoplijsten te openen en te bewerken.

Hoofdlettergevoeligheid: Als deze instelling is geactiveerd, worden bijvoorbeeld “Geef” en “geef” als verschillende woorden geteld. Als de instelling niet actief is, worden alle woorden in de resultatenlijst in kleine letters weergegeven.

Woorden lemmatiseren – als dit vakje is aangevinkt, worden de geïdentificeerde woorden in de teksten vereenvoudigd tot hun woordstammen (lemma’s) met behulp van een lemma lexicon in de gekozen taal. Bijvoorbeeld, als een tekst de woorden “gaf”, “gegeven”, en “geeft” bevat, zal MAXDictio alleen de basisvorm “geven” in de resultatentabel weergeven.

Klik op OK, om te beginnen met de analyse van de woordfrequenties. Afhankelijk van de grootte van de teksten, kan dit proces enkele ogenblikken duren. Een scherm informeert u over de voortgang van de analyse.