Articles

Word Frequencies: Analyze Word Frequencies

Najprostsza funkcja MAXDictio określa słownictwo wszystkich tekstów bieżącego projektu.

Dostęp do tej funkcji można uzyskać poprzez:

  • wybranie opcji MAXDictio > Częstotliwości wyrazów, lub
  • po prostu klikając odpowiedni szybki przycisk na pasku narzędzi „MAXDictio”.

Po uruchomieniu funkcji pojawia się następujące okno dialogowe. Można w nim wybrać wszystkie potrzebne opcje.

Wybór tekstów do analizy

Tylko w aktywowanych dokumentach – procedura częstotliwości będzie ograniczona do aktywowanych plików tekstowych

Tylko w pobranych segmentach – procedura częstotliwości będzie ograniczona do zakodowanych segmentów faktycznie wyświetlanych w oknie „Pobrane segmenty”

Jeśli nie zostanie wybrana żadna z tych opcji, analizowane będą wszystkie dokumenty tekstowe i tabelaryczne w projekcie MAXQDA.

Uwaga: Należy pamiętać, że myślniki nie są rozpoznawane w dokumentach PDF.

Różnicowanie wyników

Brak: Tabela wyników nie różnicuje wyników, podając jedynie sumy dla wszystkich analizowanych tekstów.

Według dokumentów, grup dokumentów, zestawów dokumentów: Tabela wyników zawiera dodatkowe kolumny, które można wykorzystać do porównania częstotliwości występowania słów w obrębie poszczególnych dokumentów, grup dokumentów lub zestawów dokumentów (patrz Różnicowanie według dokumentów, grup dokumentów i zestawów dokumentów). Gdy wybrana jest opcja Tylko dla dokumentów aktywowanych, brane są pod uwagę tylko dokumenty aktywowane w obrębie grup dokumentów lub zestawów dokumentów i analizowane będą tylko grupy dokumentów lub zestawy dokumentów zawierające dokumenty aktywowane.

Według kodów: Opcja ta jest dostępna tylko wtedy, gdy analiza jest ograniczona do segmentów w „Segmentach pobranych” i zostało wykonane „Proste zapytanie kodowe”. Tabela wyników zawiera dodatkowe kolumny częstości powtarzających się dla każdego kodu, który występuje w „Systemie kodów”. Opcja ta jest szczególnie przydatna, gdy teksty zostały podzielone na jednostki tekstowe za pomocą kodów do analizy MAXDictio, ponieważ pozwala na porównanie częstotliwości słów w obrębie różnych kodów.

Dalsze opcje

Znaki do obcięcia: Kliknięcie przycisku z trzema kropkami spowoduje otwarcie okna dialogowego, w którym można wprowadzić znaki, które mają zostać odcięte od słów i zignorowane podczas liczenia. Wybrane znaki w oknie dialogowym mają zastosowanie do wszystkich funkcji opartych na słowach w MAXQDA i MAXDictio.

Jak MAXDictio definiuje „słowo”? Słowo, jak pokazano powyżej, jest dowolną sekwencją znaków pomiędzy dwoma znakami ograniczającymi. Delimitery mogą być, na przykład, pustymi spacjami lub znakami interpunkcyjnymi. Weźmy na przykład „praca”. Jako ostatnie słowo zdania, to słowo jest ograniczone spacją po lewej stronie i kropką po prawej stronie.

Znaki, które mają być użyte jako ograniczniki, muszą być wprowadzone w oknie dialogowym „Znaki do odcięcia”. Zazwyczaj są to znaki interpunkcyjne, znaki zapytania itp. Wybór znaków jest przechowywany w odpowiednim projekcie, więc te same wyniki zostaną uzyskane dla funkcji MAXDictio, nawet jeśli plik zostanie otwarty na innym komputerze. Domyślnie, następujące znaki są wprowadzane automatycznie w nowych projektach:

@ ! § $ % & / ( ) = ? ^ ° ’ ´ ` ” ” ” ” ” { } # + * _ . : , ; < > ~ –

Pewne problemy mogą wystąpić z myślnikami. Jeśli słowa złożone powinny być liczone jako jedno słowo i nie powinny być dzielone na poszczególne części, myślnik nie może być deklarowany jako ogranicznik. Najlepiej jest trochę poeksperymentować z różnymi możliwościami. Ponieważ zliczanie częstotliwości wyrazów można powtarzać bez znacznej straty czasu, warto przejrzeć wyniki w poszukiwaniu jakichś oczywistości, w razie potrzeby zmienić opcje, a następnie powtórzyć analizę.

Minimalna liczba znaków – wyrazy z mniejszą liczbą znaków będą pomijane

Zastosuj listę stop – jeśli ma być użyta lista stop, należy zaznaczyć odpowiednie pole. Kliknij przycisk z trzema kropkami , aby otworzyć i edytować listy przystankowe.

Czułość na wielkość liter: Jeśli to ustawienie jest aktywne, to na przykład „Daj” i „daj” będą liczone jako różne słowa. Jeśli to ustawienie jest nieaktywne, wszystkie słowa będą wyświetlane małymi literami na liście wyników.

Lematyzuj słowa – gdy to pole jest zaznaczone, zidentyfikowane słowa w tekstach zostaną uproszczone do ich rdzeni (lematów) przy użyciu leksykonu lematów w wybranym języku. Na przykład, jeśli tekst zawiera słowa „gave”, „given” i „gives”, MAXDictio wyświetli w tabeli wyników tylko formę podstawową „give”.

Kliknij OK, aby rozpocząć analizę częstotliwości słów. W zależności od wielkości tekstów, proces ten może potrwać kilka chwil. Na wyświetlaczu pojawi się informacja o postępie analizy.