Apresentação
A mineração de texto é o processo de derivar informações de alta qualidade do texto. Informação de alta qualidade é normalmente alcançada por meio da análise de padrões e tendências aplicando-se modelos de aprendizado de máquina.
As tarefas típicas de mineração de texto incluem categorização e clusterização de texto, extração de conceitos ou entidades, produção de taxonomias, análise de sentimento e sumarização de documentos.
O objetivo principal é, essencialmente, transformar texto em dados para análise, via aplicação de processamento de linguagem natural (NLP) e métodos analíticos.
O curso de Fundamentos da Mineração de Texto é parte das atividades de ensino relacionadas com a Ciência de Dados que vem sendo trabalhadas na Fiocruz Brasília nos últimos anos.
Concepção pedagógica
A temática do curso está voltada para a área das ciências sociais aplicadas com a análise de textos de publicações científicas, questionários, consultas públicas e outros;
Serão abordados os conceitos introdutórios sobre a Ciência de Dados e a Mineração de Texto, análise léxica e uso de ferramentas de apoio;
O curso tem o objetivo prático de apresentar ferramentas de apoio a análise de dados com a mineração de textos além de realizar atividades práticas de levantamento e tratamento de dados com o tratamento, visualização e análise dos dados.
Competências e Habilidades a serem desenvolvidas
Ao final do curso o aluno deverá ser capaz de:
Geral: Aplicar os métodos de mineração e análise de textos nas atividades de pesquisa
Específicos: i) Entender questões introdutórias e históricas à Ciência de Dados; ii) Estudar os conceitos gerais sobre análise textos e aplicação dos métodos; iii) Avaliar diferentes ferramentas existentes para o auxílio no trabalho com texto; iv) Realizar atividades práticas de levantamento, tratamento e análise
As tarefas típicas de mineração de texto incluem categorização e clusterização de texto, extração de conceitos ou entidades, produção de taxonomias, análise de sentimento e sumarização de documentos.
O objetivo principal é, essencialmente, transformar texto em dados para análise, via aplicação de processamento de linguagem natural (NLP) e métodos analíticos.
O curso de Fundamentos da Mineração de Texto é parte das atividades de ensino relacionadas com a Ciência de Dados que vem sendo trabalhadas na Fiocruz Brasília nos últimos anos.
Concepção pedagógica
A temática do curso está voltada para a área das ciências sociais aplicadas com a análise de textos de publicações científicas, questionários, consultas públicas e outros;
Serão abordados os conceitos introdutórios sobre a Ciência de Dados e a Mineração de Texto, análise léxica e uso de ferramentas de apoio;
O curso tem o objetivo prático de apresentar ferramentas de apoio a análise de dados com a mineração de textos além de realizar atividades práticas de levantamento e tratamento de dados com o tratamento, visualização e análise dos dados.
Competências e Habilidades a serem desenvolvidas
Ao final do curso o aluno deverá ser capaz de:
- Conhecer os principais conceitos de Mineração de Texto;
- Conhecer e utilizar corretamente as ferramentas IRAMuTeQ, plataforma R e editor de texto (sublime ou outro);
- Aplicar os conceitos e ferramentas utilizadas no curso para obter e disponibilizar informação sobre pesquisas.
Geral: Aplicar os métodos de mineração e análise de textos nas atividades de pesquisa
Específicos: i) Entender questões introdutórias e históricas à Ciência de Dados; ii) Estudar os conceitos gerais sobre análise textos e aplicação dos métodos; iii) Avaliar diferentes ferramentas existentes para o auxílio no trabalho com texto; iv) Realizar atividades práticas de levantamento, tratamento e análise