Articles

Frequências de Palavras: Analyze Word Frequencies

A função mais simples da MAXDictio determina o vocabulário de todos os textos de um projeto atual.

Esta função pode ser acessada por:

  • selecionando a opção MAXDictio > Frequências de Palavras, ou
  • clicando apenas no botão rápido correspondente na barra de ferramentas “MAXDictio”.

Após iniciar a função, aparece a seguinte janela de diálogo. Aqui você pode selecionar todas as opções necessárias.

Seleção de textos a serem analisados

Apenas para documentos ativados – o procedimento de freqüências será restrito aos arquivos de texto ativados

Apenas nos segmentos recuperados – o procedimento de freqüências será restrito aos segmentos codificados realmente exibidos na janela “Segmentos recuperados”

Se nenhuma das opções for selecionada, todos os documentos de texto e tabela do projeto MAXQDA serão analisados.

Por favor, note que a hifenização não é reconhecida nos documentos PDF.

Diferenciação de resultados

Nenhum: A tabela de resultados não diferencia os resultados, fornecendo apenas os totais sobre todos os textos analisados.

Por documentos, grupos de documentos, conjuntos de documentos: A tabela de resultados contém colunas adicionais que podem ser usadas para comparar a freqüência de palavras dentro de documentos individuais, grupos de documentos ou conjuntos de documentos (ver Diferenciação por documentos, grupos de documentos e conjuntos de documentos). Quando a opção Apenas para documentos ativados é selecionada, apenas documentos ativados dentro dos grupos de documentos ou conjuntos de documentos são levados em consideração, e apenas grupos de documentos ou conjuntos de documentos contendo documentos ativados serão analisados.

Por Códigos: Esta opção só está disponível se a análise estiver restrita aos segmentos nos “Segmentos recuperados” e uma “Consulta Simples de Codificação” tiver sido realizada. A tabela de resultados contém colunas adicionais de freqüências recorrentes para cada código que aparece no “Sistema de códigos”. Esta opção é particularmente útil quando os textos foram divididos em unidades de texto usando códigos para análise MAXDictio, pois permite comparar as freqüências de palavras dentro de diferentes códigos.

Outras opções

Caracteres a serem cortados: Ao clicar no botão com três pontos , será aberta uma caixa de diálogo na qual poderá introduzir caracteres que serão cortados das palavras e ignorados durante a contagem. Os caracteres seleccionados na caixa de diálogo aplicam-se a todas as funções baseadas em palavras em MAXQDA e MAXDictio.

Como é que MAXDictio define uma “palavra”? Uma palavra, como mostrado acima, é qualquer sequência de caracteres entre dois caracteres delimitadores. Os delimitadores podem ser, por exemplo, espaços em branco ou sinais de pontuação. Pegue o exemplo “trabalho”. Como última palavra de uma frase, esta palavra é delimitada por um espaço à sua esquerda e um ponto à sua direita.

Os caracteres a serem usados como delimitadores devem ser inseridos na caixa de diálogo “Caracteres a serem cortados”. Normalmente estes caracteres incluem pontos de pontuação, pontos de interrogação, etc. A selecção de caracteres é armazenada no respectivo projecto, pelo que serão obtidos os mesmos resultados para as funções MAXDictio, mesmo que se abra o ficheiro noutro computador. Por defeito, os seguintes caracteres são introduzidos automaticamente em novos projectos:

@ ! § $ % & / ( ) = ? ^ ° ‘ ´ ` ” ” ” ” ” { } # + * _ . : , ; < > ~ –

Salguns problemas podem ocorrer com hífenes. Se palavras compostas devem ser contadas como uma palavra e não devem ser divididas em suas partes separadas, o hífen não pode ser declarado como um delimitador. É melhor experimentar um pouco com diferentes possibilidades. Como a contagem das frequências das palavras pode ser repetida sem perda significativa de tempo, é aconselhável procurar nos resultados quaisquer conspicuidades, alterar as opções se necessário, e depois repetir a análise.

Número mínimo de caracteres – palavras com menos caracteres serão puladas

Aplicar lista de paradas – Se uma lista de paradas deve ser usada, a caixa correspondente deve ser marcada. Clique no botão com os três pontos para abrir e editar as listas de paragem.

Sensibilidade da caixa: Se esta configuração estiver activada, “Dar” e “dar”, por exemplo, serão contadas como palavras diferentes. Se a configuração estiver inativa, todas as palavras serão exibidas em minúsculas na lista de resultados.

Lemmatize words – quando esta caixa for marcada, as palavras identificadas nos textos serão simplificadas para suas hastes de palavras (lemmas) usando um léxico lemma na língua escolhida. Por exemplo, se um texto contém as palavras “gave”, “given”, e “gives”, MAXDictio listará a forma base “give” apenas na tabela de resultados.

Clique OK, para iniciar a análise das frequências das palavras. Dependendo do tamanho dos textos, este processo pode levar alguns momentos. Um display informa sobre o progresso da análise.