Estas visualizações apresentam os resultados de uma análise panorâmica da obra poética de António Ramos Rosa. Os valores são expressos em frequência absoluta. A análise quantitativa foi realizada após remoção de stop words e lematização do corpus. O uso de stopwords deixa de fora da análise os artigos, conjunções e outras palavras irrelevantes para este fim. A lematização permite que, por exemplo, as 2260 ocorrências do termo “palavra” contabilizem tanto o termo no singular como no plural. Constituído por 79 livros, o corpus inclui 391.890 palavras, subtraído para 181.291 após a retirada das stopwords. As análises foram realizadas em linguagem R no ambiente RStudio e as visualizações foram produzidas com recurso ao RAWGraphs. O código encontra-se disponível para inspeção e reuso (↓ script R).
Quais os termos mais frequentes na poesia de António Ramos Rosa?

↓ dados
Qual a distribuição dos termos mais frequentes por livro?

↓ dados
Que termos ocorrem em mais livros?

↓ dados
Qual a distribuição, por livro, dos termos que ocorrem em mais livros?

↓ dados
Bigramas
As visualizações seguintes apresentam os resultados de uma análise de bigramas na poesia de Ramos Rosa, isto é, dos pares de palavras com maior expressividade em termos de frequência absoluta. As análises foram realizadas após remoção de stop words e lematização do corpus, em linguagem R no ambiente RStudio, tendo as visualizações sido produzidas com recurso ao RAWGraphs. O código encontra-se disponível para inspeção e reuso (↓ script R). É possível ler uma memória descritiva deste conjunto de visualizações.
Quais os pares de palavras mais frequentes?

↓ dados
A considerar os 10 termos mais frequentes (Visão Panorâmica), quais são os 10 termos que mais se relacionam entre si de entre os bigramas que contêm esses pares?

↓ dados
A considerar os 50 bigramas mais frequentes em todo o corpus, quais são os mais co-ocorrentes?

↓ dados