Articles

Ordfrekvenser: Analysera ordfrekvenser

Den enklaste funktionen i MAXDictio fastställer ordförrådet för alla texter i ett aktuellt projekt.

Denna funktion kan nås genom att antingen:

  • välja alternativet MAXDictio > Ordfrekvenser, eller
  • när du klickar på motsvarande snabbknapp i verktygsfältet ”MAXDictio”.

När du startat funktionen visas följande dialogfönster. Här kan du välja alla alternativ du behöver.

Väljning av texter som ska analyseras

Endast för aktiverade dokument – frekvensförfarandet kommer att begränsas till de aktiverade textfilerna

Endast i hämtade segment – frekvensförfarandet kommer att begränsas till de kodade segmenten som faktiskt visas i fönstret ”Retrieved Segments”

Om inget av alternativen väljs, kommer alla text- och tabelldokument i MAXQDA-projektet att analyseras.

Observera: Observera att bindestreck inte känns igen i PDF-dokument.

Differentiering av resultat

Ingen: Resultattabellen differentierar inte resultaten, utan ger bara totaler för alla analyserade texter.

På dokument, dokumentgrupper, dokumentuppsättningar: Resultattabellen innehåller ytterligare kolumner som kan användas för att jämföra ordfrekvensen inom enskilda dokument, dokumentgrupper eller dokumentuppsättningar (se Differentiering efter dokument, dokumentgrupper och dokumentuppsättningar). När alternativet Endast för aktiverade dokument är markerat beaktas endast aktiverade dokument inom dokumentgrupperna eller dokumentuppsättningarna, och endast dokumentgrupper eller dokumentuppsättningar som innehåller aktiverade dokument kommer att analyseras.

Med koder: Det här alternativet är endast tillgängligt om analysen begränsas till segmenten i ”Retrieved Segments” och en ”Simple Coding Query” har utförts. Resultattabellen innehåller ytterligare kolumner med återkommande frekvenser för varje kod som förekommer i ”Code System”. Det här alternativet är särskilt användbart när texter har delats upp i textenheter med hjälp av koder för MAXDictio-analys, eftersom det gör det möjligt att jämföra ordfrekvenserna inom olika koder.

Förre alternativ

Tecken som ska avgränsas: Genom att klicka på knappen med tre prickar öppnas en dialogruta där du kan ange tecken som ska avskiljas från orden och ignoreras under räkningen. De valda tecknen i dialogrutan gäller för alla ordbaserade funktioner i MAXQDA och MAXDictio.

Hur definierar MAXDictio ett ”ord”? Ett ord är, som visats ovan, en sekvens av tecken mellan två avgränsande tecken. Avgränsande tecken kan till exempel vara blanksteg eller skiljetecken. Ta exemplet ”arbete”. Som sista ord i en mening avgränsas detta ord av ett mellanslag till vänster och ett punktum till höger.

De tecken som ska användas som avgränsare måste anges i dialogrutan ”Tecken som ska avgränsas”. Vanligtvis omfattar dessa tecken interpunktionstecken, frågetecken osv. Valet av tecken lagras i respektive projekt så att samma resultat erhålls för MAXDictio-funktionerna även om du öppnar filen på en annan dator. Som standard anges följande tecken automatiskt i nya projekt:

@ ! § $ % & / ( ) = ? ^ ° ’ ´ ` ” ” ” ” ” { } # + * _ . : , ; < > ~ –

Vissa problem kan uppstå med bindestreck. Om sammansatta ord ska räknas som ett ord och inte delas upp i sina separata delar får bindestrecket inte deklareras som en avgränsare. Det är bäst att experimentera lite med olika möjligheter. Eftersom räkningen av ordfrekvenser kan upprepas utan någon större tidsförlust är det lämpligt att titta igenom resultaten för att hitta eventuella anmärkningar, ändra alternativen vid behov och sedan upprepa analysen.

Minimalt antal tecken – ord med färre tecken kommer att hoppas över

Använda stopplista – Om en stopplista ska användas måste motsvarande ruta vara markerad. Klicka på knappen med de tre prickarna för att öppna och redigera stopplistorna.

Känslighet för stora bokstäver: Om den här inställningen är aktiverad räknas till exempel ”Give” och ”ge” som olika ord. Om inställningen är inaktiv kommer alla ord att visas med små bokstäver i resultatlistan.

Lemmatisera ord: När den här rutan är markerad kommer de identifierade orden i texterna att förenklas till sina ordstammar (lemmor) med hjälp av ett lemmalexikon på det valda språket. Om en text till exempel innehåller orden ”gav”, ”given” och ”ger” kommer MAXDictio endast att lista grundformen ”ge” i resultattabellen.

Klicka på OK för att påbörja analysen av ordfrekvenser. Beroende på texternas storlek kan denna process ta några ögonblick. En display informerar dig om hur analysen fortskrider.