Agenda de defesas Agenda de defesas

Voltar

Pós-Graduação em Ciência da Computação realiza defesa de dissertação amanhã (7)

A defesa acontecerá às 14h, via Google Meet

O Programa de Pós-Graduação em Ciência da Computação, do Centro de Informática (CIn) da UFPE, promove amanhã (7) a defesa da dissertação de mestrado “sPerC: Um Classificador Baseado em Perturbação para Dados Multimodais”. O trabalho, produzido pelo mestrando Rodolfo José de Oliveira Soares, orientado por George Darmiton Cavalcanti e coorientado por Edson Leite Araújo, será defendido às 14h no Google Meet. A banca examinadora será composta pelo orientador e pelos professores Hansenclever de França Bassani (Centro de Informática/UFPE) e Thiago Oliveira dos Santos (Departamento de Informática/Ufes).

Resumo

Na literatura, a teoria bayesiana é amplamente utilizada como base para a geração de novos modelos supervisionados, dada sua robustez em diversos contextos. Entre as diferentes técnicas embasadas no modelo estatístico, o classificador baseado em perturbações (PerC, do inglês Perturbation-based Classifier) utiliza as alterações ocorridas nos parâmetros , chamadas de , para rotular novas amostras, tendo seu desempenho comprovado em vários cenários. Entretanto, quando o PerC é submetido a problemas que seguem uma distribuição multimodal, sua performance, e seu poder de generalização, degradam. Neste contexto, a multimodalidade pode ser observada quando exemplos de uma mesma classe formam grupos (clusters) dispersos no espaço de características. Assim, a multimodalidade aumenta a complexidade dos dados, reduzindo o nível de discernimento dos vetores médios e matrizes de covariâncias estimadas pelo classificador PerC. Para preencher essa lacuna, este trabalho apresenta uma nova abordagem de classificação para o algoritmo PerC, intitulada sPerC (do inglês, subconcept PerC), no qual utiliza o algoritmo K-Means para particionar os dados do problema em clusters, fornecendo-os como entrada para a técnica PerC, com o intuito de aprimorar o poder de generalização do modelo. A partir da combinação de quatro diferentes clustering validation índices, o valor do parâmetro ¿ é estimado para o algoritmo K-Means. Vale destacar que nenhum conhecimento prévio, sobre os domínios em estudo, é levado em consideração ao definir o valor do parâmetro. Experimentos foram conduzidos usando 30 bases de dados disponíveis nos repositórios KEEL e UCI Machine Learning, comparando o desempenho do método proposto em relação às técnicas PerC (versão original), Árvore de Decisão, k-NN, Multilayer Perceptron (MLP), Naïve Bayes, Random Forest e Support Vector Machine (SVM). Os resultados demonstraram a eficácia do trabalho proposto, alcançando desempenho competitivo em relação aos métodos Random Forest e Árvore de Decisão, e sendo significativamente superior aos algoritmos PerC, MLP e SVM, segundo os testes estatísticos de Wilcoxon e Friedman. Por fim, 22 medidas de complexidades foram adotadas na extração de características das bases de dados e utilizadas na construção de um meta-learning dataset para descrever os cenários favoráveis para a aplicação do método sPerC, a partir de um meta-classificador..

Data da última modificação: 06/10/2020, 20:42