Articles

Frecvențe de cuvinte: Analyze Word Frequencies

Cea mai simplă funcție a MAXDictio determină vocabularul tuturor textelor unui proiect curent.

Această funcție poate fi accesată fie prin:

  • selectarea opțiunii MAXDictio > Word Frequencies, fie
  • doar făcând clic pe butonul rapid corespunzător din bara de instrumente „MAXDictio”.

După pornirea funcției, apare următoarea fereastră de dialog. Aici puteți selecta toate opțiunile de care aveți nevoie.

Selectarea textelor care urmează să fie analizate

Only for activated documents – procedura de frecvențe va fi limitată la fișierele text activate

Only in retrieved segments – procedura de frecvențe va fi limitată la segmentele codificate afișate efectiv în fereastra „Retrieved Segments”

Dacă nu este selectată niciuna dintre opțiuni, vor fi analizate toate documentele text și tabelare din proiectul MAXQDA.

Vă rugăm să rețineți: Vă rugăm să fiți conștienți de faptul că cratima nu este recunoscută în documentele PDF.

Diferențierea rezultatelor

Niciuna: Tabelul de rezultate nu diferențiază rezultatele, oferind doar totalurile pe toate textele analizate.

Pe documente, grupuri de documente, seturi de documente: Tabelul de rezultate conține coloane suplimentare care pot fi utilizate pentru a compara frecvența cuvintelor în cadrul documentelor individuale, grupurilor de documente sau seturilor de documente (a se vedea Diferențierea în funcție de documente, grupuri de documente și seturi de documente). Atunci când este selectată opțiunea Only for activated documents (Numai pentru documente activate), sunt luate în considerare numai documentele activate din cadrul grupurilor de documente sau seturilor de documente și vor fi analizate numai grupurile de documente sau seturile de documente care conțin documente activate.

By Codes (Prin coduri): Această opțiune este disponibilă numai dacă analiza este limitată la segmentele din „Segmente recuperate” și dacă a fost efectuată o „Interogare simplă de codificare”. Tabelul de rezultate conține coloane suplimentare de frecvențe recurente pentru fiecare cod care apare în „Code System”. Această opțiune este deosebit de utilă atunci când textele au fost împărțite în unități de text folosind coduri pentru analiza MAXDictio, deoarece vă permite să comparați frecvențele cuvintelor în cadrul diferitelor coduri.

Opțiuni suplimentare

Caractere care trebuie tăiate: Făcând clic pe butonul cu trei puncte , se va deschide o casetă de dialog în care puteți introduce caracterele care vor fi tăiate din cuvinte și ignorate în timpul numărătorii. Caracterele selectate în caseta de dialog se aplică tuturor funcțiilor bazate pe cuvinte din MAXQDA și MAXDictio.

Cum definește MAXDictio un „cuvânt”? Un cuvânt, așa cum s-a arătat mai sus, este orice secvență de caractere între două caractere de delimitare. Delimitatorii pot fi, de exemplu, spații libere sau semne de punctuație. Să luăm exemplul „muncă”. Fiind ultimul cuvânt al unei propoziții, acest cuvânt este delimitat de un spațiu în stânga și de un punct în dreapta.

Caracterele care urmează să fie utilizate ca delimitatori trebuie introduse în caseta de dialog „Caractere de tăiat”. În mod normal, aceste caractere includ semne de punctuație, semne de întrebare etc. Selecția caracterelor este stocată în proiectul respectiv, astfel încât se vor obține aceleași rezultate pentru funcțiile MAXDictio chiar dacă deschideți fișierul pe un alt calculator. În mod implicit, următoarele caractere sunt introduse automat în proiectele noi:

@ ! § $ % & / ( ) = ? ^ ° ‘ ´ ` ” ” ” ” ” { } # + * _ . : , ; < > ~ –

Pot apărea unele probleme cu liniuțele. În cazul în care cuvintele compuse ar trebui să fie numărate ca un singur cuvânt și să nu fie împărțite în părțile lor separate, cratima nu poate fi declarată ca delimitator. Cel mai bine este să experimentați puțin cu diferite posibilități. Deoarece numărarea frecvențelor cuvintelor poate fi repetată fără pierderi semnificative de timp, este recomandabil să se analizeze rezultatele pentru a găsi orice conspicuitate, să se modifice opțiunile, dacă este necesar, și apoi să se repete analiza.

Număr minim de caractere – cuvintele cu mai puține caractere vor fi omise

Aplicați lista de oprire – Dacă se dorește utilizarea unei liste de oprire, caseta corespunzătoare trebuie bifată. Faceți clic pe butonul cu cele trei puncte pentru a deschide și edita listele de oprire.

Sensibilitate la majuscule: Dacă această setare este activată, „Give” și „give”, de exemplu, vor fi socotite ca fiind cuvinte diferite. Dacă setarea este inactivă, toate cuvintele vor fi afișate cu minuscule în lista de rezultate.

Lematizarea cuvintelor – atunci când această casetă este bifată, cuvintele identificate în texte vor fi simplificate la tulpinile lor (lemne) prin utilizarea unui lexicon de lemne în limba aleasă. De exemplu, dacă un text conține cuvintele „a dat”, „a dat” și „dă”, MAXDictio va lista doar forma de bază „dă” în tabelul de rezultate.

Click pe OK, pentru a începe analiza frecvențelor cuvintelor. În funcție de mărimea textelor, acest proces poate dura câteva momente. Un afișaj vă informează cu privire la progresul analizei.

.