A mineração de texto é o processo de derivar informações de alta qualidade do texto. Informação de alta qualidade é normalmente alcançada por meio da análise de padrões e tendências aplicando-se modelos de aprendizado de máquina.
As tarefas típicas de mineração de texto incluem categorização e clusterização de texto, extração de conceitos ou entidades, produção de taxonomias, análise de sentimento e sumarização de documentos.
O objetivo principal é, essencialmente, transformar texto em dados para análise, via aplicação de processamento de linguagem natural (NLP) e métodos analíticos.
O curso de Fundamentos da Mineração de Texto é parte das atividades de ensino relacionadas com a Ciência de Dados que vem sendo trabalhadas na Fiocruz Brasília nos últimos anos.
Concepção pedagógica
A temática do curso está voltada para a área das ciências sociais aplicadas com a análise de textos de publicações científicas, questionários, consultas públicas e outros;
Serão abordados os conceitos introdutórios sobre a Ciência de Dados e a Mineração de Texto, análise léxica e uso de ferramentas de apoio;
O curso tem o objetivo prático de apresentar ferramentas de apoio a análise de dados com a mineração de textos além de realizar atividades práticas de levantamento e tratamento de dados com o tratamento, visualização e análise dos dados.
Competências e Habilidades a serem desenvolvidas
Ao final do curso o aluno deverá ser capaz de: