Índice de Qualidade Final – Um Novo Índice para Avaliação de Agrupamento Aplicado à Análise da Infraestrutura do Rio de Janeiro – um estudo comparativo entre bairros e favelas / Final Quality Index - A New Index for Clustering Evaluation Applied to Rio de Janeiro's Infrastructure Analysis - a comparative study between districts and slums

Joana A. Siqueira, Karla Figueiredo, Marley M.B.R. Vellasco

Abstract


Os métodos de agrupamento, apesar de amplamente usados, ainda não possuem uma teoria generalizada e amplamente aceita, dado que diferentes métodos podem fornecer resultados distintos, já que mesmo a técnica mais adequada pode variar de acordo com características intrínsecas aos dados, que nem sempre se tem conhecimento prévio. De maneira geral, não há consenso sobre quais métodos melhor se aplicam a cada caso. Mesmo considerando as diversas métricas já criadas para avaliar a qualidade dos agrupamentos, não há convergência entre os resultados dessas medidas, pois na elaboração de análises de agrupamentos há uma série de aspectos subjetivos - como a escolha do método mais adequado e do número de grupos – que podem impactar nos agrupamentos finais e comprometer os resultados obtidos. Nesse sentido, este trabalho tem como principal objetivo apresentar um novo índice de avaliação de agrupamentos, denominado Índice de Qualidade Final (IQF). Trata-se de um índice que conjuga resultados de diversas medidas de avaliação da qualidade dos grupos e, a partir disso, permite escolher o agrupamento mais adequado aos dados, dentre as diversas metodologias conhecidas. Em paralelo, e para aplicação do IQF, foi realizada uma análise da infraestrutura do Município do Rio de Janeiro, com foco na comparação entre áreas de favela e não favela. Foram utilizados diversos métodos de agrupamento com posterior aplicação do IQF para avaliar o índice proposto e identificar se há, de fato, questões de infraestrutura que caracterizam as favelas e as diferenciam dos demais bairros da cidade. Os resultados obtidos permitem elencar e ordenar os agrupamentos formados orientando a escolha do agrupamento mais satisfatório, indicando que o novo índice proposto poderá ajudar na avaliação de forma eficiente.


Keywords


Seleção de agrupamentos; métodos de agrupamento; mineração de dados; avaliação da qualidade de agrupamentos; análise socioeconômica; favelas; infraestrutura.

References


ALBUQUERQUE, M.A. Estabilidade em análise de agrupamento. Pernambuco: Universidade Federal Rural de Pernambuco, Departamento de física e matemática, 2005. Dissertação de mestrado.

ALBUQUERQUE, M.A. et al. Estabilidade em análise de agrupamento: estudo de caso em ciência florestal. Revista Árvore, v.30, p.257-265, 2006.

ALMEIDA, L.G.P. Análise de algoritmos de agrupamento para base de dados textuais. Petrópolis, RJ: Laboratório Nacional de Computação Científica, 2007. Dissertação de mestrado.

ANDERBERG, M.B. Cluster Analysis for applications. Londres: AcademicPress, 1973.

ARABIE, P.; HUBERT, L.J. e DE SOETE G. Clustering and Classification. Londres: Kluwer Academic Publishers, 1996.

ARNALDO, H.A.; BEDREGAL, B.R.C. Um novo método de inicialização para o algoritmo fuzzy c-means. In: Encuentro Chileno de Computación, Temuco. Proceedings JCC 2013, 2013. p. 1-7.

BORGES, V.R.P. Comparação entre as técnicas de agrupamento K-means e Fuzzy C-means para segmentação de imagens coloridas. In: VIII Encontro Anual de Computação, Goiás, 2010.

BRAGA, A.P. et al. Redes Neurais Artificiais: Teorias e Aplicações. 2ª edição. Rio de Janeiro: LTC, 2012.

BROCK, G.; DATTA, S.; PIHUR, V.; DATTA, S. clValid: An R Package for Cluster Validation. Journal of Statistical Software, 2008.

CARDOSO JUNIOR, M.M. Uso de técnicas de geração de agrupamentos para determinação no número de classes dos portos que movimentam granéis sólidos. Rio Grande do Sul: XLII SBPO, 2010.

CASSIANO, K.M. Análise de Séries Temporais Usando Análise Espectral Singular (SSA) e Clusterização de Suas Componentes Baseada em Densidade. Rio de Janeiro: Pontifícia Universidade Católica do Rio de Janeiro, 2014. Tese de doutorado.

COLETTA, L.F.S. Análise de Estratégias de Seleção de Atributos Baseada em Agrupamento de Dados Fuzzy. São Paulo: Universidade de São Paulo, Instituto de Ciências Matemáticas e de Computação, 2009. Monografia.

CROTTI JUNIOR, A. et al. Os algoritmos Fuzzy C-Means, Robust C-Prototypes e Unsupervised Robust C-Prototypes aplicados à uma base de dados das bacias hidrográficas da Região de Criciúma. Santa Catarina: Universidade do Extremo Sul Catarinense. Disponível em . Acessado em dezembro de 2018.

CHATFIELD, C.; COLLINS, A.J. Introduction to multivariate analysis. 1ª edição. Reino Unido: Chapman & Hall/CRC, 2018.

DEEPASHRI. K.S.; ASHWINI. K. Survey on Techniques of Data Mining and its Applications. India: International Journal of Emerging Research in Management &Technology, 2017. ISSN: 2278-9359 (Volume-6, Issue-2)

DIAZ, J.R.; PORRAS, J.C.C.; LAVERDA, R.M. Tecnicas de logica difusa aplicadas a la mineria de datos. Universidad Tecnológica de Pereira, Scientist et Technica Año XIII, Vol 3, 2008.

EVERITT, B.L.S.; LEESE M. Clusters Analysis. 4ª edição. Londres: Arnold, 2001.

FARIA, P.N. Avaliação de métodos para determinação do número ótimo de clusters em estudo de divergência genética entre acessos de pimenta. Minas Gerais, Viçosa: Universidade Federal de Viçosa, Departamento de Estatística Aplicada e Biometria, 2009. Dissertação de mestrado.

FUNG, G. A comprehensive overview of basic clustering algorithms, 2001. Disponível em < http://pages.cs.wisc.edu/~gfung/clustering.pdf>. Acesso em agosto de 2018.

GAVA, E.M. et al. O Algoritmo Density-Based Spacial Clustering of Applications With Noise (DBSCAN) na Clusterização dos Indicadores de Dados Ambientais. Santa Catarina: 2012. Disponível em . Acessado em setembro de 2018.

HALKIDI, M.; VAZIRGIANNIS, M.; BATISTAKIS, Y. Clustering validity checking methods: part I. Athens University of Economics & Business, Association for Computing Machinery Sigmod Conference, Vol. 31, 2002a.

HALKIDI, M.; VAZIRGIANNIS, M.; BATISTAKIS, Y. Clustering validity checking methods: part II. Athens University of Economics & Business, Association for Computing Machinery Sigmod Conference, Vol. 31, 2002b.

IBGE – INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Censo demográfico 2010: Aglomerados subnormais – primeiros resultados. Rio de Janeiro, 2010.

KOHONEN, T. Self-Organizing Maps. 3ª edição. Berlin: 2001.

LINDEN, R. Técnicas de agrupamento. Rio de Janeiro: Revista de Sistemas de Informação da FSMA, 2009.

MINGOTI, S.A. Análise de dados através de métodos de estatística multivariada: Uma abordagem aplicada. Belo Horizonte: Editora UFMG, 2005.

RASKUTTI, B.; LECKIE, C. An Evaluation of Criteria for Measuring the Quality of Cluster. San Francisco: Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence, pp 905-910, 1999.

SILVA, L.R.S.; GOMIDE, F. Um estudo comparativo entre as funções de validação para agrupamento nebuloso de dados. Santa Catarina: IV Congresso Brasileiro de Computação – CBComp, 2004.

SIQUEIRA, J.A. Mineração de dados aplicada à análise da infraestrutura do município do Rio de Janeiro. Rio de Janeiro: Pontifícia Universidade Católica do Rio de Janeiro, Departamento de Engenharia Elétrica, 2015. Dissertação de mestrado.

VALE, M.N. Agrupamento de dados: avaliação de métodos e desenvolvimento de aplicativo para análise de grupos. Rio de Janeiro: Pontifícia Universidade Católica do Rio de Janeiro, Departamento de Engenharia Elétrica, 2005. Dissertação de mestrado.

VICINI, L. Análise multivariada da teoria à prática. Santa Maria: UFSM, CCNE, 2005.




DOI: https://doi.org/10.34117/bjdv6n5-372

Refbacks

  • There are currently no refbacks.